L’évolution modulaire des protéines : un point de vue phylogénétique

2011 
La diversite du monde vivant repose pour une large part sur la diversite des proteines codees dans les genomes. Comment une telle diversite a-t-elle ete generee ? La theorie classique postule que cette diversite resulte a la fois de la divergence de sequence et de la combinatoire des arrangements de proteines en domaines a partir de quelques milliers de domaines anciens, mais elle n’explique pas les nombreuses proteines orphelines.Dans cette these, nous avons etudie l’evolution des proteines du point de vue de leur decomposition en domaines en utilisant trois bases de donnees : HOGENOM (familles de proteines homologues), Pfam (familles de domaines expertisees) et ProDom (familles de modules proteiques construites automatiquement). Chaque famille d’HOGENOM a ainsi ete decomposee en domaines de Pfam ou modules de ProDom. Nous avons modelise l’evolution de ces familles par un reseau Bayesien base sur l’arbre phylogenetique des especes. Dans le cadre de ce modele, on peut reconstituer rigoureusement les scenarios d’evolution les plus probables qui refletent la presence ou l’absence de chaque proteine, domaine ou module dans les especes ancestrales. La mise en relation de ces scenarios permet d’analyser l’emergence de nouvelles proteines en fonctions de domaines ou modules ancestraux. L’analyse avec Pfam suggere que la majorite de ces evenements resulte de rearrangements de domaines anciens, en accord avec la theorie classique. Cependant une part tres significative de la diversite des proteines est alors negligee. L’analyse avec ProDom, au contraire, suggere que la majorite des nouvelles proteines ont recrute de nouveaux modules proteiques. Nous discutons les biais de Pfam et de ProDom qui permettent d’expliquer ces points de vue differents. Nous proposons que l’emergence de nouveaux modules proteiques peut resulter d’un turn-over rapide de sequences codantes, et que cette innovation au niveau des modules est essentielle a l’apparition de nombreuses proteines nouvelles tout au long de l’evolution.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []