OATAO - Open Archive Toulouse Archive Ouverte Open Access Week

Taxonomie et inférence fonctionnelle des procaryotes : développement de MACADAM, une base de données devoies métaboliques associées à une taxonomie

Le boulch, Malo. Taxonomie et inférence fonctionnelle des procaryotes : développement de MACADAM, une base de données devoies métaboliques associées à une taxonomie. PhD, Pathologie, Toxicologie, Génétique et Nutrition, Institut National Polytechnique de Toulouse, 2019

[img]
Preview
(Document in English)

PDF (Author's version) - Requires a PDF viewer such as GSview, Xpdf or Adobe Acrobat Reader
9MB

Abstract

Les procaryotes sont des organismes ubiquitaires vivant en communauté et possédant une extrême diversité métabolique en lien avec leur omniprésence. Pour contribuer à la compréhension du rôle fonctionnel des procaryotes, nous avons développé MACADAM : une base de données de voies métaboliques associées à une taxonomie centrée sur les procaryotes.L'objectif était de mettre à disposition de la communauté scientifique des données d'informations fonctionnelles sélectionnées sur leur qualité (qualité des génomes, qualité des annotations), enaccès libre et interopérables. MACADAM regroupe les PGDBs (Pathway/Genome DataBase)construites à partir de génome RefSeq répondant aux critères de qualité complete genome enutilisant le logiciel Pathway Tools. Afin d’enrichir MACADAM, MicroCyc, une collection de PGDBsmanuellement curées par des experts, a été ajoutée. Enfin, les informations fonctionnellessourcées à partir de la littérature contenues dans FAPROTAX et IJSEM phenotypic databasessont ajoutées. MACADAM contient 13195 PGDBs bactériennes, 314 PGDBs d’archées et 1260voies métaboliques uniques. Construit à l'aide de technologies interopérables (Python 3, SQLite),sous un format téléchargeable et avec un code ouvert, MACADAM peut être intégré dans desoutils qui nécessitent de lier une information taxonomique à une information fonctionnelle. Pouraméliorer sa visibilité auprès de la communauté de microbiologistes, MACADAM est consultableen ligne (http://macadam.toulouse.inra.fr). Utilisant la taxonomie de la base de données NCBITaxonomy, MACADAM permet de relier un taxon allant du phylum à l'espèce à une informationfonctionnelle. Chaque voie métabolique est associée à deux scores de complétude (PathwayScore et Pathway Frequency Score). A chaque mise à jour, MACADAM intègre les nouvellesversions de RefSeq, du NCBI Taxonomy et de MicroCyc, permettant de suivre au plus près lescorrections apportées à la taxonomie et d'inclure les informations disponibles pour les nouveauxgénomes déposés. Deux exemples d'utilisation de MACADAM et une comparaison avec uneapproche d'inférence à partir de lectures métagénomiques ont permis de discuter les points fortset les faiblesses (i) de MACADAM et (ii) de l'inférence par une approche d'identificationtaxonomique préalable. L'identification des individus au sein de la communauté procaryotebénéficie largement des avancées en technologie de séquençage et du raffinement des pipelinesd’analyses bioinformatiques. L’analyse des lectures issues de séquençages métagénomiquesaboutit à la reconstruction de génomes putatifs ou espèces métagénomiques. Dans ce cadre,nous nous sommes penchés sur la problématique de correction d’assignation taxonomiqued’espèces métagénomiques en utilisant une approche par reconstruction d’un arbrephylogénétique d’une part et en utilisant un indice global de parenté génomique (ANI) d’autre part.Ce travail nous a permis de préciser le positionnement de neuf groupes d'espècesmétagénomiques et mis en évidence des erreurs d'affiliation de génome de référence chezMegasphaera et Blautia Obeum et de confirmer le reclassement de Ruminococcus gauvreauiidans le genre Blautia. Pour limiter les erreurs et leur réplication il convient de veiller à la qualité del'information contenue dans les bases de données. Dans ce cadre, la communauté scientifiquedevrait avoir une meilleure connaissance des règles de la nomenclature et des méthodes de systématique. Un intérêt accru devrait être porté pour valoriser les efforts de correction des données présentes dans les bases de données. Enfin, bien que la métagénomique permette de mieux comprendre les communautés microbiennes qui nous entourent, un effort de culture desorganismes réputés incultivables permettrait d'accroître les connaissances et la diversité desorganismes procaryotes dans les banques de données. Ces efforts se répercuteront directementsur la qualité des informations de MACADAM.

Item Type:PhD Thesis
Uncontrolled Keywords:
Institution:Université de Toulouse > Institut National Polytechnique de Toulouse - Toulouse INP (FRANCE)
Laboratory name:
Research Director:
Pascal, Géraldine and Combes, Sylvie
Statistics:download
Deposited On:25 Feb 2020 13:16

Repository Staff Only: item control page