13 février 2017
L'équipe Salk développe un outil qui cartographie les zones fonctionnelles du génome pour mieux comprendre la maladie
L'équipe Salk développe un outil qui cartographie les zones fonctionnelles du génome pour mieux comprendre la maladie
LA JOLLA — La plupart d'entre nous seraient perdus sans Google Maps ou autres technologies de guidage routier similaires. Et lorsque ces outils cartographiques incluent des données supplémentaires sur le trafic ou la météo, nous pouvons naviguer encore plus efficacement. Pour les scientifiques qui explorent le génome des mammifères afin de mieux comprendre les causes génétiques des maladies, la combinaison de différents types de données facilite également leur recherche.
Une équipe du Salk Institute a développé un algorithme informatique intégrant deux types de données différents pour localiser des régions clés du génome avec plus de précision et d'exactitude que d'autres outils. La méthode, détaillée la semaine du 13 février 2017, dans Actes de l'Académie nationale des sciences, pourrait aider les chercheurs à mener des recherches beaucoup plus ciblées sur les variantes génétiques causant des maladies dans le génome humain, telles que celles qui favorisent le cancer ou provoquent des troubles métaboliques.

Cliquez ici pour une image haute résolution
Crédit : Salk Institute
« La plupart des variations entre les individus se situent dans les régions non codantes du génome », explique l’auteur principal. Joseph Ecker, chercheur à l'Institut médical Howard Hughes et directeur du laboratoire d'analyse génomique de Salk. « Ces régions ne codent pas pour des protéines, mais elles contiennent néanmoins des variants génétiques responsables de maladies. Jusqu'à présent, nous ne disposions tout simplement pas d'outils très efficaces pour localiser ces zones dans divers tissus et types de cellules. »
Seulement environ 98 % de notre ADN est constitué de gènes, qui codent pour des protéines essentielles à notre santé et à notre fonctionnement. Pendant de nombreuses années, les XNUMX % restants ont été considérés comme des « déchets » externes. Mais, grâce au développement d'outils toujours plus sophistiqués pour sonder le génome, il est devenu évident qu'une grande partie de ces « déchets » jouent un rôle régulateur essentiel. Par exemple, des sections d'ADN appelées « amplificateurs » déterminent où et quand l'information génétique est lue.
De plus en plus, les mutations ou les perturbations des activateurs sont liées à des causes majeures de maladies humaines, mais ces activateurs sont difficiles à localiser dans le génome. Des indices à leur sujet peuvent être trouvés dans certains types de données expérimentales, comme la liaison de protéines régulant l'activité des gènes, les modifications chimiques des protéines (appelées histones) autour desquelles l'ADN s'enroule, ou la présence de composés chimiques appelés groupes méthyles dans l'ADN qui activent ou désactivent les gènes (un facteur épigénétique appelé méthylation de l'ADN). Généralement, les méthodes informatiques pour trouver des activateurs s'appuient sur des données de modification des histones. Mais le nouveau système d'Ecker, baptisé REPTILE (pour « prédiction des éléments régulateurs basée sur des signatures épigénomiques locales spécifiques aux tissus »), combine les données de modification et de méthylation des histones pour prédire quelles régions du génome contiennent des activateurs. Lors des expériences menées par l'équipe, REPTILE s'est avéré plus précis pour trouver des activateurs que les algorithmes qui s'appuient uniquement sur la modification des histones.

Cliquez ici pour une image haute résolution.
Crédit : Salk Institute
« L'originalité de cette méthode réside dans le fait qu'elle utilise la méthylation de l'ADN pour affiner les séquences régulatrices candidates suggérées par les données de modification des histones », explique Yupeng He, étudiant diplômé de Salk et premier auteur de l'article. « Nous avons ensuite pu tester les prédictions de REPTILE en laboratoire et les valider avec des données expérimentales, ce qui nous a donné une grande confiance dans la capacité de l'algorithme à identifier des activateurs. »
L'algorithme REPTILE fonctionne en deux étapes principales : l'apprentissage et la prédiction. Pour l'apprentissage, l'équipe Salk a appris à REPTILE à reconnaître les activateurs de mammifères en alimentant l'algorithme avec les emplacements des activateurs connus et des zones génomiques autres que les activateurs dans l'ADN. Lors de l'étape de prédiction, l'algorithme a été exécuté sur neuf lignées cellulaires et tissus murins et cinq lignées cellulaires et tissus humains dont les régions amplificatrices étaient inconnues, et a identifié les emplacements des activateurs potentiels. Enfin, l'équipe a utilisé des données issues d'expériences en laboratoire pour vérifier si les prédictions faites par REPTILE lors de l'étape de prédiction correspondaient à de véritables régions régulatrices. Les activateurs augmentant l'activité des gènes cibles, les chercheurs peuvent tester l'activité des séquences d'ADN en les reliant à un gène rapporteur et en observant si le gène cible supposé augmente. À l'aide d'outils moléculaires, l'équipe a modifié des embryons de souris de manière à ce que l'activation des activateurs déclenche l'expression des rapporteurs liés, ce qui peut être surveillé par coloration. Ainsi, si REPTILE prédisait qu'un activateur spécifique était lié au développement du prosencéphale de la souris, l'équipe pouvait rechercher un motif de coloration dans la région du prosencéphale de l'embryon. Si elle le voyait, la prédiction de REPTILE était considérée comme valide. L'équipe de Salk a également testé les prédictions de REPTILE par rapport à quatre autres algorithmes de recherche d'activateurs couramment utilisés. Globalement, REPTILE a surpassé chacun d'eux, trouvant les régions d'activateurs avec une plus grande précision (en se rapprochant d'elles le long du brin d'ADN) et moins d'erreurs (d'identification erronée). En particulier, REPTILE a mieux réussi que les autres systèmes à trouver des activateurs dans des types de tissus différents de ceux sur lesquels il avait été entraîné.
« Le nombre de variants génétiques dans le génome est énorme », explique Ecker. « Pour identifier ceux qui causent des maladies, il est donc essentiel de mettre en lumière les régions que vous jugez les plus importantes, et l'identification des activateurs est une étape cruciale du processus. »
Parmi les autres auteurs figuraient Joseph R. Nery et Rosa G. Castanon du Salk Institute ; David U. Gorkin, Ah Young Lee et Bing Ren du Université de Californie, San Diego; Diane E. Dickel, Axel Visel et Len A. Pennacchio de Lawrence Berkeley National Laboratory; et Yin Shen du Université de Californie, San Francisco.
Les travaux ont été financés par le Fondation caritative HA et Mary K. Chapman, le Fondation AP Giannini, le National Institutes of Health, le Gordon et Betty Moore Foundation et la Institut californien de médecine régénérative.
BLOG
Actes de l'Académie nationale des sciences
AUTEURS
Yupeng He, David U. Gorkin, Diane E. Dickel, Joseph R. Nery, Rosa G. Castanon, Ah Young Lee, Yin Shen, Axel Visel, Len A. Pennacchio, Bing Ren et Joseph R. Ecker
Bureau des communications
Tél: (858) 453-4100
presse@salk.edu
L’Institut Salk est un institut de recherche indépendant à but non lucratif, fondé en 1960 par Jonas Salk, inventeur du premier vaccin antipoliomyélitique sûr et efficace. Sa mission est de mener des recherches fondamentales, collaboratives et audacieuses pour relever les défis les plus urgents de la société, tels que le cancer, la maladie d’Alzheimer et la vulnérabilité de l’agriculture. Ces travaux scientifiques fondamentaux sous-tendent tous les efforts de recherche translationnelle, générant des connaissances qui permettent la mise au point de nouveaux médicaments et des innovations à l’échelle mondiale.