Skip to main content

Article Category

Nachrichten

Article available in the folowing languages:

Wie die schnelle und effiziente Identifikation von riesigen Gen-Datensätzen der Forschung zum Coronavirus hilft

Ein internationales Forschungsteam untersucht, wie sich immense Mengen an Genomsequenzdaten ordnen und analysieren lassen, damit sie in der Biomedizin genutzt werden können.

Gesundheit

Durch die Weiterentwicklung der Sequenziertechnologie ist es möglich, gigantische Mengen an Genomsequenzdaten verschiedener Spezies zu produzieren. Die Untersuchung pangenomischer Daten – also des gesamten Gensatzes, den alle Mitglieder einer Art gemeinsam haben – ist von zentraler Bedeutung, besonders in Bereichen wie der Bakterien- und Virenforschung, der Untersuchung von Resistenzmechanismen gegen Arzneimittel und der Entwicklung von Impfstoffen. Warum ist zum Beispiel das Coronavirus gegen gängige Medikamente resistent? Kann Big Data dazu beitragen, die Besonderheiten solcher neuen Virusstämme in kurzer Zeit zu ermitteln? Eine Gruppe von Forschenden, die von dem EU-finanzierten PANGAIA Projekt (Pan-genome Graph Algorithms and Data Integration) unterstützt wird, stellt sich nun dieser Herausforderung. Dabei werden Verfahren entwickelt, anhand derer gigantische Gen-Datensätze verglichen werden können. Laut einer Pressemitteilung der Universität Bielefeld, die als Projektpartner agiert, verwendet die Wissenschaft oft ein Referenzgenom, um zu klären, ob das Erbgut eines Lebewesens besondere Abweichungen aufweist. „Dafür werden mehrere Genome so kombiniert, dass sie die typischen Eigenschaften einer ganzen Spezies zeigen. So können Forschende ein neues Influenzavirus mit einem Referenzgenom vergleichen, das die typischen Merkmale der ursprünglichen Virusstämme zusammenfasst.“ In der gleichen Pressemitteilung sagt Prof. Dr. Jens Stoye von der Universität Bielefeld: „In diesen Fällen vergleichen wir nur zwei Genome miteinander – Unterschiede und Gemeinsamkeiten sind am Computer relativ leicht zu erkennen.“ Er fügt hinzu: „Mit dem neuen Ansatz können wir in einem einzigen Schritt ein Genom mit Tausenden anderen Genomen vergleichen.“ Dieses Verfahren involviert die Pangenomik. „Die neue Technologie ermöglicht die gleichzeitige, integrierte Analyse vieler Stämme desselben Organismus. Das können Viren, Bakterien und mitunter auch höhere Lebewesen sein.“ Prof. Stoye fährt fort: „Damit lassen sich Ähnlichkeiten und Unterschiede der einzelnen Mitglieder hervorheben. Bei Krankheitserregern lassen sich häufig sogar die Abläufe, die zur Entstehung besonders infektiöser Stämme geführt haben, verstehen und vorhersagen.“

Genetische Abweichungen

Das neue Verfahren kann außerdem zum Erkennen von Erbkrankheiten bei Menschen oder zum Ermitteln von genetischen Abweichungen angewandt werden, heißt es in der Pressemitteilung weiter. „Um die computergestützte Pangenomik schneller und anwendungsfreundlicher zu machen, wollen wir mit unseren Projektpartnerinnen und -partnern in den nächsten Jahren neue Algorithmen und Datenstrukturen entwickeln“, sagt Prof. Dr. Alexander Schönhuth, ebenfalls von der Universität Bielefeld. Das Projektteam möchte Algorithmen entwickeln, mit denen Computer nach Ähnlichkeiten und Unterschieden zwischen den Vergleichsgenomen suchen und die Ergebnisse grafisch darstellen können. Mit diesen Darstellungen könnten die Forschenden „ganz neuartige Mutationen identifizieren, wie sie vermutlich bei der aktuell in China ausgebrochenen Variante des Coronavirus aufgetreten sind und die zu Resistenzen gegen die gängigen Medikamente geführt haben“, merkt Prof. Schönhuth an. Das Projekt PANGAIA läuft noch bis Ende Dezember 2023. Es wird sich auf die auf Graphen basierende Darstellung großer Genom-Datensätze konzentrieren und ihre Vorteile gegenüber der traditionellen sequenzbasierten Darstellung von pangenomischen Daten aufzeigen. „In dem Projekt wird dieser Paradigmenwechsel – von sequenzbasierten zu auf Graphen basierten Darstellungen von Genomen – vollzogen werden,“ heißt es auf der CORDIS-Projektwebsite. „Darum können wir eine Vielzahl an in der Praxis relevanten Vorteile erwarten, bei denen die Anordnung, Analyse, Kompression, Integration und Nutzung von Genomdaten grundlegend sind.“ Weitere Informationen: PANGAIA-Projektwebsite

Schlüsselbegriffe

coronavirus

Länder

Italien

Verwandte Artikel