Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS

Deep learning-based text mining for interpretation of omics data

Description du projet

Nouvelle technologie de fouille de textes pour l’interprétation des données omiques

Les technologies omiques produisent des mégadonnées à un rythme de plus en plus élevé, et leur interprétation implique une association entre des entités individuelles dans le contexte de réseaux moléculaires. Ces associations sont dérivées non seulement des données omiques, mais également des réseaux prégénérés créés par la fouille de textes de millions d’articles scientifiques. Le projet DeepTextNet, financé par l’UE, vise à extraire de nouvelles informations des sources de la littérature biomédicale sur le type et la direction des associations moléculaires. Plus précisément, l’objectif est de construire une technologie de fouille de textes de nouvelle génération pour l’extraction de relations d’interactions moléculaires, utilisant l’apprentissage profond et les mégadonnées pour l’entraînement, par opposition aux petits ensembles de données sélectionnées manuellement et utilisés dans les méthodologies actuelles.

Objectif

"The academic community and the pharmaceutical industry use omics technologies to produce big data at an incredibly increasing rate but are faced with major challenges when it comes to their interpretation. Key for this interpretation is the association between individual entities, which in a biological context means creating molecular networks. These associations cannot be derived from the omics data alone, but rely heavily on pre-generated networks created by text mining of millions of scientific articles. One of the most popular sources of such networks is the STRING database, which currently serves ~100,000 users monthly.
Many of these users work with omics data and a major obstacle, which limits potential benefits for them, is that literature-derived networks are made up of ""functional associations"", stating only that two molecules do something together, but neither the interaction type nor the direction. Hence, our hypothesis is that state-of-the-art computational approaches will be able to exploit new possibilities in network biology that emerge from big data. The key objective of DeepTextNet is to extract novel information from the biomedical literature on the type and direction of gene/protein associations. Specifically, a new paradigm will be realized by building a next generation text mining technology for relation extraction of molecular interactions that explicitly utilizes deep learning and, in contrast to current methodology, makes use of big data for training as opposed to small manually curated datasets. This new strategy for obtaining comprehensive molecular networks with both type and direction for the interactions is precisely what is currently missing for the interpretation of omics data. We expect the impact to be high and wide, as on top of applying this strategy on omics datasets as part of the project, the new technology will feed directly into STRING, which is used globally and integrated into workflows in both academia and industry."

Champ scientifique (EuroSciVoc)

CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.

Vous devez vous identifier ou vous inscrire pour utiliser cette fonction

Mots‑clés

Les mots-clés du projet tels qu’indiqués par le coordinateur du projet. À ne pas confondre avec la taxonomie EuroSciVoc (champ scientifique).

Programme(s)

Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

Thème(s)

Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

Régime de financement

Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.

MSCA-IF - Marie Skłodowska-Curie Individual Fellowships (IF)

Voir tous les projets financés dans le cadre de ce programme de financement

Appel à propositions

Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.

(s’ouvre dans une nouvelle fenêtre) H2020-MSCA-IF-2020

Voir tous les projets financés au titre de cet appel

Coordinateur

KOBENHAVNS UNIVERSITET
Contribution nette de l'UE

La contribution financière nette de l’UE est la somme d’argent que le participant reçoit, déduite de la contribution de l’UE versée à son tiers lié. Elle prend en compte la répartition de la contribution financière de l’UE entre les bénéficiaires directs du projet et d’autres types de participants, tels que les participants tiers.

€ 207 312,00
Coût total

Les coûts totaux encourus par l’organisation concernée pour participer au projet, y compris les coûts directs et indirects. Ce montant est un sous-ensemble du budget global du projet.

€ 207 312,00
Mon livret 0 0