Modèles à variables latentes pour des données issues de tiling arrays. Applications aux expériences de ChIP-chip et de transcriptome.

2011 
Les puces tiling arrays sont des puces a haute densite permettant l'exploration des genomes a grande echelle. Elles sont impliquees dans l'etude de l'expression des genes et de la detection de nouveaux transcrits grâce aux experiences de transcriptome, ainsi que dans l'etude des mecanismes de regulation de l'expression des genes grâce aux experiences de ChIP-chip. Dans l'objectif d'analyser des donnees de ChIP-chip et de transcriptome, nous proposons une modelisation fondee sur les modeles a variables latentes, en particulier les modeles de Markov caches, qui sont des methodes usuelles de classification non-supervisee. Les caracteristiques biologiques du signal issu des puces tiling arrays telles que la dependance spatiale des observations le long du genome et l'annotation structurale sont integrees dans la modelisation. D'autre part, les modeles sont adaptes en fonction de la question biologique et une modelisation est proposee pour chaque type d'experiences. Nous proposons un melange de regressions pour la comparaison de deux echantillons dont l'un peut etre considere comme un echantillon de reference (ChIP-chip), ainsi qu'un modele gaussien bidimensionnel avec des contraintes sur la matrice de variance lorsque les deux echantillons jouent des roles symetriques (transcriptome). Enfin, une modelisation semi-parametrique autorisant des distributions plus flexibles pour la loi d'emission est envisagee. Dans un objectif de classification, nous proposons un controle de faux-positifs dans le cas d'une classification a deux groupes et pour des observations independantes. Puis, nous nous interessons a la classification d'un ensemble d'observations constituant une region d'interet, telle que les genes. Les differents modeles sont illustres sur des jeux de donnees reelles de ChIP-chip et de transcriptome issus d'une puce NimbleGen couvrant le genome entier d'Arabidopsis thaliana.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    147
    References
    0
    Citations
    NaN
    KQI
    []