Annotation structurale et fonctionnelle automatique des génomes de plantes Couplée à un Système d’Information.

Démarré en 2013 pour une durée de 2 ans, ce projet a été sélecti
onné dans le cadre de l’appel à projets LifeGrid 2012 et reçoit une aide financière du Conseil Régional d’Auvergne et du Feder.

Les enjeux

Une annotation exhaustive et de qualité d’un génome de plante est essentielle pour toute approche de génomique comparative et évolutive, pour l’analyse et
la gestion de la diversité génétique, pour l’identification des gènes candidats en vue d’une amélioration génétique des plantes, ainsi que pour une meilleure
utilisation des ressources naturelles.
Néanmoins, il est important de réaliser qu’annoter un génome (identification de la structure et de la fonction biochimique des gènes) tel que celui du blé tendre de 17 Gigabases (Gb), soit cinq fois le génome humain, nécessite une approche automatique.

Une première version de pipeline appelée TriAnnot a été mise en place en janvier 2008 grâce à une collaboration étroite avec l’URGI (Unité de Recherche Génome Informatique, INRA). Cette version a été largement améliorée et a permis l’annotation automatique des 1Gb du chromosome 3B de blé tendre en 26 heures.

L’IWGSC (International Wheat Genome Sequencing Consortium), qui regroupe plus de 500 membres de plus de 30 pays à travers le monde, a pour ambition
de séquencer et d’annoter les 21 chromosomes du génome de blé tendre, aussi le pipeline TriAnnot représente-t-il une pièce cruciale dans l’atteinte de
ces objectifs.


Il est par ailleurs prévu de faire évoluer TriAnnot vers l’annotation d’autres espèces végétales (chêne, peuplier, maïs, riz et orge).

Les objectifs

Le projet, porté par l’UMR GDEC (Génétique Diversité et Ecophysiologie des Céréales – INRA/UBP), vise à poursuivre les amélioration du pipeline TriAnnot et à faciliter l’intégration des données issues de l’annotation automatique dans le système d’information de l’URGI.


Ainsi, il est prévu une intégration de nouveaux modules (annotation des ARN non codants, identification de marqueurs moléculaires génétiques particuliers, détection automatique de pseudo-gènes), une modification de certains modules existants et le développement d’une version dérivée du pipeline, TriAnnot-post, qui permettra de lancer uniquement la partie annotation fonctionnelle de l’actuel pipeline TriAnnot à partir d’un fichier de protéines expertisées. Il est ég
alement prévu d'adosser TriAnnot à ORCAE, une interface pour l'expertise manuelle en ligne en collaboration avec le VIB (Gand, Belgique).

Durée
2 ANS
Budget
NC
Financement
Conseil Régional d'Auvergne ; FEDER