De l'huile de palme dans le lait : comment l'Union européenne renforce sa présence sur le marché laitier Ouest africain en vendant un succédané de poudre de lait

2020 
Le francais du Burkina est marque par le multilinguisme national. Dans l'objectif d'extraire automatiquement des neologismes sur des donnees textuelles, nous avons developpe l'approche Extraneo. Celle-ci integre des outils de Traitement automatique du langage naturel (TALN) pour detecter les neologismes formels et leurs contextes d'utilisation. Extraneo combine un etiqueteur morphosyntaxique et un lexique flexionnel pour identifier les neologismes candidats, valides ensuite manuellement. L'usage de patrons de glose permet enfin d'acceder aux contextes des neologismes valides. Dans cet article, quatre etiqueteurs morphosyntaxiques, cinq lexiques flexionnels et des marqueurs de glose sont evalues afin de detecter les plus performants. Les resultats montrent que sur les articles de journaux, l'etiqueteur TreeTagger obtient la plus forte F-mesure, 0.86 en matiere d'etiquetage. Sur l'identification des neologismes candidats, les lexiques DELA et Morphalou obtiennent la Fmesure la plus elevee, 0.52. La mise en relief des contextes des neologismes valides revele que le contexte definitoire detient la precision la plus elevee, a savoir 0.49, devant les contextes de denomination (0.22) et d'equivalence (0.24).
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []