Construction et stratégie d’exploitation des réseaux de confusion en lien avec le contexte applicatif de la compréhension de la parole

2008 
Cette these s’interesse aux reseaux de confusion comme representation compacte et structuree des hypotheses multiples produites par un moteur de reconnaissance de parole et transmises a un module de post-traitement applicatif. Les reseaux de confusion (CN pour Confusion Networks) sont generes a partir des graphes de mots et structurent l’information sous la forme d’une sequence de classes contenant des hypotheses de mots en concurrence. Le cas d’usage etudie dans ces travaux est celui des hypotheses de reconnaissance transmises a un module de comprehension de la parole dans le cadre d’une application de dialogue deployee par France Telecom. Deux problematiques inherentes a ce contexte applicatif sont soulevees. De facon generale, un systeme de dialogue doit non seulement reconnaitre un enonce prononce par un utilisateur, mais aussi l’interpreter afin de deduire sons sens. Du point de vue de l’utilisateur, les performances percues sont plus proches de celles de la chaine complete de comprehension que de celles de la reconnaissance vocale seule. Ce sont ces performances que nous cherchons a optimiser. Le cas plus particulier d’une application deployee implique de pouvoir traiter des donnees reelles et donc tres variees. Un enonce peut etre plus ou moins bruite, dans le domaine ou hors-domaine, couvert par le modele semantique de l’application ou non, etc. Etant donnee cette grande variabilite, nous posons la question de savoir si le fait d’appliquer les memes traitements sur l’ensemble des donnees, comme c’est le cas dans les approches classiques, est une solution adaptee. Avec cette double perspective, cette these s’attache a la fois a enrichir l’algorithme de construction des CNs dans le but d’optimiser globalement le processus de comprehension et a proposer une strategie adequate d’utilisation des reseaux de confusion dans le contexte d’une application reelle. Apres une analyse des proprietes de deux approches de construction des CNs sur un corpus de donnees reelles, l’algorithme retenu est celui du "pivot". Nous en proposons une version modifiee et adaptee au contexte applicatif en introduisant notamment un traitement differencie des mots du graphe qui privilegie les mots porteurs de sens. En reponse a la grande variabilite des enonces a traiter dans une application deployee, nous proposons une strategie de decision a plusieurs niveaux qui vise a mieux prendre en compte les specificites des differents types d’enonces. Nous montrons notamment qu’il est preferable de n’exploiter la richesse des sorties multiples que sur les enonces reellement porteurs de sens. Cette strategie permet a la fois d’optimiser les temps de calcul et d’ameliorer globalement les performances du systeme
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    49
    References
    0
    Citations
    NaN
    KQI
    []