Extraction d'information `a partir de documents Web multilingues : une approche d'analyses structurelles

2006 
Les ressources d'information multilingues sur le Web sont devenues de plus en plus des objets d'etudes importantes pour differents domaines intervenant au traitement de l'information. Neanmoins, nous constatons que la structure des ressources multilingues est tres peu exploree par rapport a l'abondance des methodes de traitement automatique des langues naturelles. Dans cette these, nous abordons l'aspect multilinguisme dans un contexte de categorisation des sites Web multilingues. Nous apportons quelques connaissances experimentales portant sur la representation de documents multilingues, la modelisation des donnees en une structure homogene, la qualite de la recherche d'information dans un contexte multilingues et enfin sur les notions de frontiere et de centre de gravite pour departager des langues dominantes sans puiser dans des connaissances linguistiques.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []