Transformation d’annotations en parties du discours et lemmes vers le format Universal Dependencies : étude de cas pour l’alsacien et l’occitan.

2019 
Cet article presente un retour d’experience sur la transformation de corpus annotes pour l’alsacien et l’occitan vers le format CONLL-U defini dans le projet Universal Dependencies. Il met en particulier l’accent sur divers points de vigilance a prendre en compte, concernant la tokenisation et la definition des categories pour l’annotation.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    2
    Citations
    NaN
    KQI
    []