Projektbeschreibung
Eine neue Textmining-Technologie zur Auswertung von Omik-Daten
Omik-Technologien erzeugen Big Data mit immer rasanterem Tempo. Ihre Auswertung erfordert die Assoziation einzelner Einheiten. Dies wiederum setzt molekulare Netzwerke voraus. Solche Assoziationen können nicht aus den Omik-Daten abgeleitet werden, sondern erfordern vorgenerierte Netzwerke, die durch Textmining von mehreren Millionen wissenschaftlicher Artikel erstellt werden müssen. Das EU-finanzierte Projekt DeepTextNet bezweckt, aus Quellen der biomedizinischen Literatur neue Informationen über die Art und Richtung von Molekülassoziationen zu extrahieren. Konkret wird das Ziel verfolgt, eine Textmining-Technologie der nächsten Generation für die Beziehungsextraktion von molekularen Wechselwirkungen zu entwickeln. Diese Technologie soll auf Deep Learning basieren und – im Gegensatz zu bestehenden Methoden, die kleine, manuell zusammengestellte Datensätze nutzen – Big Data zur Schulung einsetzen.
Ziel
"The academic community and the pharmaceutical industry use omics technologies to produce big data at an incredibly increasing rate but are faced with major challenges when it comes to their interpretation. Key for this interpretation is the association between individual entities, which in a biological context means creating molecular networks. These associations cannot be derived from the omics data alone, but rely heavily on pre-generated networks created by text mining of millions of scientific articles. One of the most popular sources of such networks is the STRING database, which currently serves ~100,000 users monthly.
Many of these users work with omics data and a major obstacle, which limits potential benefits for them, is that literature-derived networks are made up of ""functional associations"", stating only that two molecules do something together, but neither the interaction type nor the direction. Hence, our hypothesis is that state-of-the-art computational approaches will be able to exploit new possibilities in network biology that emerge from big data. The key objective of DeepTextNet is to extract novel information from the biomedical literature on the type and direction of gene/protein associations. Specifically, a new paradigm will be realized by building a next generation text mining technology for relation extraction of molecular interactions that explicitly utilizes deep learning and, in contrast to current methodology, makes use of big data for training as opposed to small manually curated datasets. This new strategy for obtaining comprehensive molecular networks with both type and direction for the interactions is precisely what is currently missing for the interpretation of omics data. We expect the impact to be high and wide, as on top of applying this strategy on omics datasets as part of the project, the new technology will feed directly into STRING, which is used globally and integrated into workflows in both academia and industry."
Wissenschaftliches Gebiet (EuroSciVoc)
CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.
CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.
- NaturwissenschaftenInformatik und InformationswissenschaftenDatenbank
- NaturwissenschaftenInformatik und InformationswissenschaftenDatenwissenschaftenBig Data
- NaturwissenschaftenBiowissenschaftenBiochemieBiomoleküleProteine
- NaturwissenschaftenInformatik und Informationswissenschaftenkünstliche Intelligenzmaschinelles LernenDeep Learning
Sie müssen sich anmelden oder registrieren, um diese Funktion zu nutzen
Schlüsselbegriffe
Programm/Programme
Thema/Themen
Aufforderung zur Vorschlagseinreichung
(öffnet in neuem Fenster) H2020-MSCA-IF-2020
Andere Projekte für diesen Aufruf anzeigenFinanzierungsplan
MSCA-IF - Marie Skłodowska-Curie Individual Fellowships (IF)Koordinator
1165 Kobenhavn
Dänemark