Skip to main content
Weiter zur Homepage der Europäischen Kommission (öffnet in neuem Fenster)
Deutsch Deutsch
CORDIS - Forschungsergebnisse der EU
CORDIS

Explainable Machine Learning for Identifying the Full Heterogeneity of Peptidoforms and Proteoforms

Projektbeschreibung

Die versteckten Proteine in der Massenspektrometrie suchen

Die Proteomik, die Untersuchung von Proteinen mithilfe der Massenspektrometrie, bietet wertvolle Einblicke in die Zellfunktionen. Viele Proteinformen bleiben allerdings aufgrund ihrer Komplexität unentdeckt, was unser Verständnis von Krankheiten und möglichen Behandlungen einschränkt. Bestehende maschinelle Lernmodelle für die Proteomik können Massenspektren häufig nicht vollständig analysieren und sind nicht leicht zu interpretieren. Dieser Mangel an Transparenz behindert ihre Anwendung im klinischen Umgebungen. Vor diesem Hintergrund lautet das Ziel des ERC-finanzierten Projekts explainProt, dieses Problem durch die Entwicklung klarer, durchgängiger maschineller Lernmodelle zur Analyse komplexer Proteomik-Daten zu lösen. Durch die Kombination neuer Sequenzierungsverfahren und Nanopore-Geräte wird das Projektteam verborgene Proteine und Strukturvarianten aufdecken und so die Forschung im Bereich der Krankheitserkennung und der Entdeckung von Mikroorganismen voranbringen.

Ziel

Mass spectrometry driven proteomics allows deep insights into the working of cells. Still, the vast majority of proteoforms, representing the full heterogeneity of molecular forms of protein products in a sample, currently remain undetected in proteomics experiments. This lack of information strongly restricts our knowledge of disease progression, possible biomarkers, and therapeutic targets across a large number of diseases. Several machine learning approaches have been developed for proteomics data, but not being trained end-to-end, they cannot capture the full wealth of proteomic mass spectra and commonly remain unexplained black boxes. Within explAInProt, my team and I will develop representations of spectra that allow deploying explainable, end-to-end machine learning models on the wealth of proteomic data available, regarding both bottom-up and topdown spectra to identify novel protein variants. Explanations will allow identifying the origin of predictions and allow reducing bias and building up the trustworthiness of AI systems required for clinical applications. To verify results, we will pioneer orthogonal real-time strategies based on selective sequencing approaches and calling of amino acids that we will introduce for nanopore sequencing devices as a complementary acquisition method. All combined, this will allow to drastically increase our knowledge about the current dark matter of mass spectrometry driven proteomics: those proteins and peptides that are non-canonically modified, non-tryptic, have potentially multiple amino acid substation, or no close match in databases or result from structural variants such as fusion proteins that they remain undetected in current analyses. We will highlight applicability in two areas of particular concern in current approaches: the detection of structural variants in proteomic mass spectra and the characterization of novel microbial organisms without sufficient database information.

Wissenschaftliches Gebiet (EuroSciVoc)

CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: Das European Science Vocabulary.

Sie müssen sich anmelden oder registrieren, um diese Funktion zu nutzen

Schlüsselbegriffe

Schlüsselbegriffe des Projekts, wie vom Projektkoordinator angegeben. Nicht zu verwechseln mit der EuroSciVoc-Taxonomie (Wissenschaftliches Gebiet).

Programm/Programme

Mehrjährige Finanzierungsprogramme, in denen die Prioritäten der EU für Forschung und Innovation festgelegt sind.

Thema/Themen

Aufforderungen zur Einreichung von Vorschlägen sind nach Themen gegliedert. Ein Thema definiert einen bestimmten Bereich oder ein Gebiet, zu dem Vorschläge eingereicht werden können. Die Beschreibung eines Themas umfasst seinen spezifischen Umfang und die erwarteten Auswirkungen des finanzierten Projekts.

Finanzierungsplan

Finanzierungsregelung (oder „Art der Maßnahme“) innerhalb eines Programms mit gemeinsamen Merkmalen. Sieht folgendes vor: den Umfang der finanzierten Maßnahmen, den Erstattungssatz, spezifische Bewertungskriterien für die Finanzierung und die Verwendung vereinfachter Kostenformen wie Pauschalbeträge.

HORIZON-ERC - HORIZON ERC Grants

Alle im Rahmen dieses Finanzierungsinstruments finanzierten Projekte anzeigen

Aufforderung zur Vorschlagseinreichung

Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.

(öffnet in neuem Fenster) ERC-2023-COG

Alle im Rahmen dieser Aufforderung zur Einreichung von Vorschlägen finanzierten Projekte anzeigen

Gastgebende Einrichtung

HASSO-PLATTNER-INSTITUT FUR DIGITAL ENGINEERING GGMBH
Netto-EU-Beitrag

Finanzieller Nettobeitrag der EU. Der Geldbetrag, den der Beteiligte erhält, abzüglich des EU-Beitrags an mit ihm verbundene Dritte. Berücksichtigt die Aufteilung des EU-Finanzbeitrags zwischen den direkten Begünstigten des Projekts und anderen Arten von Beteiligten, wie z. B. Dritten.

€ 1 992 500,00
Adresse
PROF DR HELMERT STRASSE 2-3
14482 POTSDAM
Deutschland

Auf der Karte ansehen

Region
Brandenburg Brandenburg Potsdam
Aktivitätstyp
Research Organisations
Links
Gesamtkosten

Die Gesamtkosten, die dieser Organisation durch die Beteiligung am Projekt entstanden sind, einschließlich der direkten und indirekten Kosten. Dieser Betrag ist Teil des Gesamtbudgets des Projekts.

€ 1 992 500,00

Begünstigte (1)

Mein Booklet 0 0