Deep learning-based text mining for interpretation of omics data

Informacje na temat projektu

DeepTextNet

Identyfikator umowy o grant: 101023676

Strona internetowa projektu

DOI

10.3030/101023676

Projekt został zamknięty

Data podpisania przez KE 19 Marca 2021

Data rozpoczęcia 1 Listopada 2021

Data zakończenia 31 Października 2023

Finansowanie w ramach

EXCELLENT SCIENCE - Marie Skłodowska-Curie Actions

Koszt całkowity

€ 207 312,00

Wkład UE

€ 207 312,00

207 312,00

Koordynowany przez

KOBENHAVNS UNIVERSITET
Denmark

Opis projektu

Nowatorska technologia analizy tekstu do interpretacji danych omicznych

Tempo generowania dużych zbiorów danych w związku z użyciem technologii omicznych stale rośnie. Interpretacja tych informacji wiąże się z tworzeniem powiązań między pojedynczymi encjami w kontekście sieci molekularnych. Powiązania te określa się nie tylko na bazie danych omicznych, ale w znacznym stopniu również na podstawie wstępnie wygenerowanych sieci utworzonych w ramach analizy tekstowej milionów prac naukowych. Zespół finansowanego ze środków UE projektu DeepTextNet zamierza ekstrahować z literatury biomedycznej nowe informacje na temat rodzaju i kierunku powiązań molekularnych. Celem badaczy jest opracowanie nowoczesnej technologii analizy tekstu do pozyskiwania informacji o relacjach w kontekście oddziaływań cząsteczkowych. Będzie ona oparta na uczeniu głębokim, a do trenowania będzie wykorzystywać duże zbiory danych (a nie niewielkie, ręcznie selekcjonowane zbiory danych, jak w przypadku obecnych technologii).

Cel

"The academic community and the pharmaceutical industry use omics technologies to produce big data at an incredibly increasing rate but are faced with major challenges when it comes to their interpretation. Key for this interpretation is the association between individual entities, which in a biological context means creating molecular networks. These associations cannot be derived from the omics data alone, but rely heavily on pre-generated networks created by text mining of millions of scientific articles. One of the most popular sources of such networks is the STRING database, which currently serves ~100,000 users monthly.
Many of these users work with omics data and a major obstacle, which limits potential benefits for them, is that literature-derived networks are made up of ""functional associations"", stating only that two molecules do something together, but neither the interaction type nor the direction. Hence, our hypothesis is that state-of-the-art computational approaches will be able to exploit new possibilities in network biology that emerge from big data. The key objective of DeepTextNet is to extract novel information from the biomedical literature on the type and direction of gene/protein associations. Specifically, a new paradigm will be realized by building a next generation text mining technology for relation extraction of molecular interactions that explicitly utilizes deep learning and, in contrast to current methodology, makes use of big data for training as opposed to small manually curated datasets. This new strategy for obtaining comprehensive molecular networks with both type and direction for the interactions is precisely what is currently missing for the interpretation of omics data. We expect the impact to be high and wide, as on top of applying this strategy on omics datasets as part of the project, the new technology will feed directly into STRING, which is used globally and integrated into workflows in both academia and industry."

Dziedzina nauki (EuroSciVoc)

Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego. Więcej informacji: Europejski Słownik Naukowy.

Słowa kluczowe

Słowa kluczowe dotyczące projektu wybrane przez koordynatora projektu. Nie należy mylić ich z pojęciami z taksonomii EuroSciVoc dotyczącymi dziedzin nauki.

Program(-y)

Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.

H2020-EU.1.3. - EXCELLENT SCIENCE - Marie Skłodowska-Curie Actions GŁÓWNY PROGRAM
Wyświetl wszystkie projekty finansowane w ramach tego programu
H2020-EU.1.3.2. - Nurturing excellence by means of cross-border and cross-sector mobility
Wyświetl wszystkie projekty finansowane w ramach tego programu

Temat(-y)

Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.

MSCA-IF-2020 - Individual Fellowships
Wyświetl wszystkie projekty finansowane w ramach tego zagadnienia

System finansowania

Program finansowania (lub „rodzaj działania”) realizowany w ramach programu o wspólnych cechach. Określa zakres finansowania, stawkę zwrotu kosztów, szczegółowe kryteria oceny kwalifikowalności kosztów w celu ich finansowania oraz stosowanie uproszczonych form rozliczania kosztów, takich jak rozliczanie ryczałtowe.

MSCA-IF - Marie Skłodowska-Curie Individual Fellowships (IF)

Wyświetl wszystkie projekty finansowane w ramach tego programu finansowania

Zaproszenie do składania wniosków

Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.

(odnośnik otworzy się w nowym oknie) H2020-MSCA-IF-2020

Wyświetl wszystkie projekty finansowane w ramach tego zaproszenia

Koordynator

KOBENHAVNS UNIVERSITET

Wkład UE netto

€ 207 312,00

Adres

NORREGADE 10
1165 KOBENHAVN
Dania

Region

Danmark Hovedstaden Byen København

Rodzaj działalności

Higher or Secondary Education Establishments

Linki

Kontakt z organizacją Strona internetowa

Uczestnictwo w unijnych programach w zakresie badań i innowacji

sieć współpracy HORIZON

Koszt całkowity

€ 207 312,00

Opis projektu

Nowatorska technologia analizy tekstu do interpretacji danych omicznych

Cel

Słowa kluczowe

Słowa kluczowe dotyczące projektu wybrane przez koordynatora projektu. Nie należy mylić ich z pojęciami z taksonomii EuroSciVoc dotyczącymi dziedzin nauki.

Program(-y)

Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.

Temat(-y)

Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.

Zaproszenie do składania wniosków

Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.

Koordynator

Udostępnij tę stronę Udostępnij tę stronę w mediach społecznościowych

Pobierz Pobierz zawartość strony

Deep learning-based text mining for interpretation of omics data

Opis projektu

Nowatorska technologia analizy tekstu do interpretacji danych omicznych

Cel

Słowa kluczowe Słowa kluczowe dotyczące projektu wybrane przez koordynatora projektu. Nie należy mylić ich z pojęciami z taksonomii EuroSciVoc dotyczącymi dziedzin nauki.

Program(-y) Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.

Temat(-y) Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.

Zaproszenie do składania wniosków Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.

Koordynator

Udostępnij tę stronę Udostępnij tę stronę w mediach społecznościowych

Pobierz Pobierz zawartość strony

Słowa kluczowe

Słowa kluczowe dotyczące projektu wybrane przez koordynatora projektu. Nie należy mylić ich z pojęciami z taksonomii EuroSciVoc dotyczącymi dziedzin nauki.

Program(-y)

Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.

Temat(-y)

Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.

Zaproszenie do składania wniosków

Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.