Robust Recognition of Conversational Telephone Speech via Multi-condition Training and Data Augmentation

Jiří Málek,Jindřich Ždánský,Petr Cerva

Robust Recognition of Conversational Telephone Speech via Multi-condition Training and Data Augmentation

2018

Jiří Málek
Jindřich Ždánský
Petr Cerva

In this paper, we focus on automatic recognition of telephone conversational speech in scenario, when no amount of genuine telephone recordings is available for training. The training set contains only data from a significantly different domain, such as recording of broadcast news. Significant mismatch arises between training and test conditions, which leads to deteriorated performance of the resulting recognition system. We aim to diminish this mismatch using the data augmentation.

Keywords:

Speech recognition
Training set
Computer science
Broadcasting
conversational speech
Natural language processing
Artificial intelligence
recognition system

Correction
Source
Cite
Save
Machine Reading By IdeaReader

References

Citations