Explainable Machine Learning for Identifying the Full Heterogeneity of Peptidoforms and Proteoforms

Informacje na temat projektu

explainProt

Identyfikator umowy o grant: 101124385

DOI

10.3030/101124385

Data podpisania przez KE 30 Października 2024

Data rozpoczęcia 1 Grudnia 2024

Data zakończenia 30 Listopada 2029

Finansowanie w ramach

European Research Council (ERC)

Koszt całkowity

€ 1 992 500,00

Wkład UE

€ 1 992 500,00

1 992 500,00

Koordynowany przez

HASSO-PLATTNER-INSTITUT FUR DIGITAL ENGINEERING GGMBH
Germany

Opis projektu

Poszukiwanie ukrytych białek dzięki spektrometrii mas

Proteomika, czyli badanie białek za pomocą spektrometrii mas, pozwala nam poznać funkcje komórek. Wiele form białek pozostaje niewykrytych ze względu na ich złożoność, co ogranicza nasze zrozumienie chorób i utrudnia poszukiwanie potencjalnych metod ich leczenia. Konwencjonalne modele uczenia maszynowego wykorzystywane w proteomice często nie są w stanie w pełni analizować widm masowych, a ich wyniki nie są łatwe do interpretacji. Brak przejrzystości utrudnia ich zastosowanie w warunkach klinicznych. Zespół finansowanego ze środków Europejskiej Rady ds. Badań Naukowych projektu explainProt ma na celu rozwiązanie tego problemu poprzez opracowanie przejrzystych, kompleksowych modeli uczenia maszynowego do analizy złożonych danych proteomicznych. Łącząc nowe techniki sekwencjonowania i urządzenia nanoporowe, zespół zamierza odkryć ukryte dotychczas białka i warianty strukturalne, przyspieszając badania w zakresie wykrywania chorób i odkrywania drobnoustrojów.

Cel

Mass spectrometry driven proteomics allows deep insights into the working of cells. Still, the vast majority of proteoforms, representing the full heterogeneity of molecular forms of protein products in a sample, currently remain undetected in proteomics experiments. This lack of information strongly restricts our knowledge of disease progression, possible biomarkers, and therapeutic targets across a large number of diseases. Several machine learning approaches have been developed for proteomics data, but not being trained end-to-end, they cannot capture the full wealth of proteomic mass spectra and commonly remain unexplained black boxes. Within explAInProt, my team and I will develop representations of spectra that allow deploying explainable, end-to-end machine learning models on the wealth of proteomic data available, regarding both bottom-up and topdown spectra to identify novel protein variants. Explanations will allow identifying the origin of predictions and allow reducing bias and building up the trustworthiness of AI systems required for clinical applications. To verify results, we will pioneer orthogonal real-time strategies based on selective sequencing approaches and calling of amino acids that we will introduce for nanopore sequencing devices as a complementary acquisition method. All combined, this will allow to drastically increase our knowledge about the current dark matter of mass spectrometry driven proteomics: those proteins and peptides that are non-canonically modified, non-tryptic, have potentially multiple amino acid substation, or no close match in databases or result from structural variants such as fusion proteins that they remain undetected in current analyses. We will highlight applicability in two areas of particular concern in current approaches: the detection of structural variants in proteomic mass spectra and the characterization of novel microbial organisms without sufficient database information.

Dziedzina nauki (EuroSciVoc)

Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego. Więcej informacji: Europejski Słownik Naukowy.

Słowa kluczowe

Słowa kluczowe dotyczące projektu wybrane przez koordynatora projektu. Nie należy mylić ich z pojęciami z taksonomii EuroSciVoc dotyczącymi dziedzin nauki.

Program(-y)

Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.

HORIZON.1.1 - European Research Council (ERC) GŁÓWNY PROGRAM
Wyświetl wszystkie projekty finansowane w ramach tego programu

Temat(-y)

Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.

ERC-2023-COG - ERC CONSOLIDATOR GRANTS
Wyświetl wszystkie projekty finansowane w ramach tego zagadnienia

System finansowania

Program finansowania (lub „rodzaj działania”) realizowany w ramach programu o wspólnych cechach. Określa zakres finansowania, stawkę zwrotu kosztów, szczegółowe kryteria oceny kwalifikowalności kosztów w celu ich finansowania oraz stosowanie uproszczonych form rozliczania kosztów, takich jak rozliczanie ryczałtowe.

HORIZON-ERC - HORIZON ERC Grants

Wyświetl wszystkie projekty finansowane w ramach tego programu finansowania

Zaproszenie do składania wniosków

Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.

(odnośnik otworzy się w nowym oknie) ERC-2023-COG

Wyświetl wszystkie projekty finansowane w ramach tego zaproszenia

Instytucja przyjmująca

HASSO-PLATTNER-INSTITUT FUR DIGITAL ENGINEERING GGMBH

Wkład UE netto

€ 1 992 500,00

Adres

PROF DR HELMERT STRASSE 2-3
14482 POTSDAM
Niemcy

Region

Brandenburg Brandenburg Potsdam

Rodzaj działalności

Research Organisations

Linki

Kontakt z organizacją

Uczestnictwo w unijnych programach w zakresie badań i innowacji

sieć współpracy HORIZON

Koszt całkowity

€ 1 992 500,00

Beneficjenci (1)

HASSO-PLATTNER-INSTITUT FUR DIGITAL ENGINEERING GGMBH

Niemcy

Wkład UE netto

€ 1 992 500,00

Opis projektu

Poszukiwanie ukrytych białek dzięki spektrometrii mas

Cel

Słowa kluczowe

Słowa kluczowe dotyczące projektu wybrane przez koordynatora projektu. Nie należy mylić ich z pojęciami z taksonomii EuroSciVoc dotyczącymi dziedzin nauki.

Program(-y)

Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.

Temat(-y)

Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.

Zaproszenie do składania wniosków

Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.

Instytucja przyjmująca

Beneficjenci (1)

Udostępnij tę stronę Udostępnij tę stronę w mediach społecznościowych

Pobierz Pobierz zawartość strony

Explainable Machine Learning for Identifying the Full Heterogeneity of Peptidoforms and Proteoforms

Opis projektu

Poszukiwanie ukrytych białek dzięki spektrometrii mas

Cel

Słowa kluczowe Słowa kluczowe dotyczące projektu wybrane przez koordynatora projektu. Nie należy mylić ich z pojęciami z taksonomii EuroSciVoc dotyczącymi dziedzin nauki.

Program(-y) Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.

Temat(-y) Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.

Zaproszenie do składania wniosków Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.

Instytucja przyjmująca

Beneficjenci (1)

Udostępnij tę stronę Udostępnij tę stronę w mediach społecznościowych

Pobierz Pobierz zawartość strony

Słowa kluczowe

Słowa kluczowe dotyczące projektu wybrane przez koordynatora projektu. Nie należy mylić ich z pojęciami z taksonomii EuroSciVoc dotyczącymi dziedzin nauki.

Program(-y)

Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.

Temat(-y)

Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.

Zaproszenie do składania wniosków

Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.