Transformation d’annotations en parties du discours et lemmes vers le format Universal Dependencies : étude de cas pour l’alsacien et l’occitan.
2019
Cet article presente un retour d’experience sur la transformation de corpus annotes pour l’alsacien et l’occitan vers le format CONLL-U defini dans le projet Universal Dependencies. Il met en particulier l’accent sur divers points de vigilance a prendre en compte, concernant la tokenisation et la definition des categories pour l’annotation.
Keywords:
- Correction
- Source
- Cite
- Save
- Machine Reading By IdeaReader
0
References
2
Citations
NaN
KQI