Expressed sequence tag analysis in tef (Eragrostis tef (Zucc) Trotter)

2006 
Tef (Eragrostis tef (Zucc.) Trotter) is the most important cereal crop in Ethiopia; however, there is very little DNA sequence information available for this species. Expressed sequence tags (ESTs) were generated from 4 cDNA li- braries: seedling leaf, seedling root, and inflorescence of E. tef and seedling leaf of Eragrostis pilosa, a wild relative of E. tef. Clustering of 3603 sequences produced 530 clusters and 1890 singletons, resulting in 2420 tef unigenes. Ap- proximately 3/4 of tef unigenes matched protein or nucleotide sequences in public databases. Annotation of unigenes associated 68% of the putative tef genes with gene ontology categories. Identification of the translated unigenes for con- served protein domains revealed 389 protein family domains (Pfam), the most frequent of which was protein kinase. A total of 170 ESTs containing simple sequence repeats (EST-SSRs) were identified and 80 EST-SSR markers were developed. In addition, 19 single-nucleotide polymorphism (SNP) and (or) insertion-deletion (indel) and 34 intron frag- ment length polymorphism (IFLP) markers were developed. The EST database and molecular markers generated in this study will be valuable resources for further tef genetic research. Resume : Le tef (Eragrostis tef (Zucc.) Trotter) est la plus importante culture cerealiere en Ethiopie. Cependant, il existe tres peu de sequences nucleotidiques qui soient connues pour cette espece. Des etiquettes de sequences expri- mees (EST) ont ete produites a partir de quatre banques d'ADNc : feuilles de plantule, racines de plantule et inflores- cences de l'E. tef ainsi que des feuilles de plantules de l'Eragrostis pilosa, une espece sauvage apparentee. Une analyse de groupement des 3 603 sequences a permis de produire 530 contigs et 1 890 singlons pour un total de 2 420 unige- nes pour le tef. Environ trois quarts des unigenes du tef etaient homologues a des sequences proteiques ou nucleotidi- ques connues. L'annotation de ces unigenes a permis de classifier 68 % de ceux-ci parmi l'une ou l'autre des categories ontologiques. L'identification de domaines proteiques conserves a revele la presence de 389 domaines de fa- milles proteiques (Pfam) au sein des unigenes traduits dont le plus repandu etait celui des proteines kinases. Au total, 170 EST contenaient des microsatellites (EST-SSR) et 80 marqueurs en ont ete tires. De plus, 19 polymorphismes mo- nonucleotidiques (SNP) ou insertion-deletion (indel) ainsi que 34 polymorphismes de longueur des introns (IFLP) ont ete developpes. La banque de donnees pour les EST et les marqueurs moleculaires generes au cours de ce travail se- ront des outils utiles pour de futures etudes genetiques sur le tef. Mots cles : tef, culture cerealiere ethiopienne, EST, marqueurs moleculaires. (Traduit par la Redaction) Yu et al. 372
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    35
    References
    34
    Citations
    NaN
    KQI
    []