Révéler les secrets des longues molécules d’ARN
Les protéines assurent la plupart des fonctions cellulaires. Les informations permettant de produire ces protéines sont codées dans l’ADN qui est retranscrit en molécules d’ARN. Cependant, seul 1 % du génome humain est impliqué dans le codage de séquences de protéines, les 99 % des zones «non codantes» restantes du génome étant retranscrites en ARN longs (ARNlnc). Les chercheurs estiment que le génome humain contient près de 20 000 gènes ARNlnc, la plupart jouant un rôle notable dans des processus biologiques similaires, comme la compensation du dosage, la régulation transcriptionnelle et l’établissement de l’identité cellulaire. Ils sont également impliqués dans des maladies, dont le cancer et les troubles neurologiques. Malgré leur rôle important, les ARNlnc restent mal compris. Le projet lincSAFARI, financé par l’UE et soutenu par le Conseil européen de la recherche, travaille à combler ce manque de connaissances. «Nous avons pour objectif de mieux comprendre comment ces séquences de génomes se sont transformées au cours de leur évolution, de découvrir les types de fonctions qu’elles remplissent et comment elles peuvent être efficacement interrogées dans un cadre de laboratoire», indique Igor Ulitsky, chercheur à l’Institut Weizmann des sciences et coordinateur du projet lincSAFARI.
Un certain nombre de découvertes importantes
Le projet était basé sur l’hypothèse selon laquelle de nombreux loci ARNlnc jouent des rôles déterminants dans la régulation des gènes lors de la différenciation cellulaire. Cette hypothèse a été éprouvée au moyen d’une approche interdisciplinaire combinant la biologie des cellules souches, la biologie moléculaire et la biologie informatique. «Comme cette méthodologie était évolutive, nous avons été en mesure d’étudier pleinement les ARN longs non caractérisés, en nous intéressant à terme à leurs bases individuelles», explique Igor Ulitsky. «Cela nous a permis non seulement de comprendre les fonctions assurées par les ARNlnc mais, plus important encore, de comprendre comment ces fonctions peuvent être exploitées pour identifier des cibles thérapeutiques et créer des médicaments.» Cette méthodologie a également abouti à un certain nombre de découvertes importantes. Par exemple, les chercheurs ont découvert un moyen pour comparer efficacement les séquences d’ARNlnc de différentes espèces, et ce processus leur a permis de découvrir de très petites zones importantes sur le plan fonctionnel. «Nous avons découvert un ARNlnc qui s’avère prometteur comme cible thérapeutique pour un type d’épilepsie», ajoute Igor Ulitsky. «Nous avons également identifié une famille d’éléments d’ARN courts jusqu’alors inconnus dictant la destination cellulaire finale de l’ARN long qui les contient.»
Partir de zéro
Selon Igor Ulitsky, ce projet s’est avéré particulièrement éprouvant car il demandait aux chercheurs de partir quasiment de zéro. «Lorsque nous avons entamé ce projet, nous ne savions presque rien des gènes avec lesquels nous avions travaillé», fait‑il remarquer. «Mais à la fin du projet, nous en savions beaucoup, notamment sur leur fonction, sur la manière dont cette fonction est liée à des conditions physiologiques spécifiques et, en partie, sur la façon dont ces fonctions s’expriment.» Les chercheurs s’efforcent maintenant de généraliser ces résultats pour des centaines de milliers d’ARNlnc pour lesquels le mystère reste entier. «Grâce aux méthodes que nous avons développées au cours du projet lincSAFARI, nous n’avons plus besoin de procéder étape par étape, nous pouvons au lieu de cela procéder dans le cadre d’un processus efficace et rationalisé», conclut Igor Ulitsky. Ces recherches constitueront l’essentiel du projet lncIMPACT, financé par l’UE.
Mots‑clés
lincSAFARI, longues molécules d’ARN, cellule souche, biologie, séquences de protéines, ADN, ARN, génome humain