Analyse statistique des amas hydrophobes hca contenus dans les banques de sequences de proteines

1997 
Les domaines proteiques globulaires de taille courante sont le resultat d'une separation quasiment parfaite entre la surface composee d'acides amines essentiellement hydrophiles, et le coeur, constitue par des acides amides amines hydrophobes. L'etude realisee a consiste dans un premier temps, a mettre en evidence la sur-representation et la sous-representation d'un certain nombre de classes d'amas hydrophobes au sens hca en comparant les nombres d'occurrences des amas dans des banques de sequences non redondantes a ceux obtenus dans des banques de sequences aleatoires de composition identique en acide amines, en se basant sur les valeurs de zscores pour chaque amas. Dans cette etude, les acides amines v, i, l, f, m, y, w sont hydrophobes et p est considere comme etant interrupteur. Ensuite, la liste d'acides amines hydrophobes ainsi que l'acide amine interrupteur, furent modifies pour mettre en evidence le role joue par l'alphabet utilise lors de l'extraction des amas hydrophobes et evaluer l'impact specifique de chaque acide amine hydrophobe ou hydrophile sur les resultats. 118 alphabets differents ont ete testes. Une etude complementaire menee sur des banques de structures a abouti a l'identification de la relation presque univoque qui existe entre certains amas et les structures secondaires regulieres des proteines globulaires. La combinaison des resultats issus des banques de structures et des banques de sequences constitue une mine d'information precieuse qui pourra etre exploitee pour l'amelioration des methodes de prediction de structure des domaines globulaires.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    1
    Citations
    NaN
    KQI
    []