Forschungs- & Entwicklungsinformationsdienst der Gemeinschaft - CORDIS

Schnelle und flexible Anfragebeantwortungssysteme

Fortschritte im Bereich der Biotechnologie und vor allem genomische Verfahren haben zu einem reichhaltigen Schatz an Sequenzdaten geführt. Das Finden relevanter Sequenzdaten in entsprechend großen Datenbanken macht ein prinzipienbasiertes, formalisiertes Modell erforderlich. Diese Angelegenheit ist von EU-finanzierten Forschern erfolgreich bewältigt worden.
Schnelle und flexible Anfragebeantwortungssysteme
Wissenschaftler verwenden für die Datenabfrage üblicherweise Datenbank-Sequenz-Ähnlichkeitssuchen. Öffentliche Datenbanken wie bspw. GenBank und UniProt/SwissProt umfassen allerdings mehrere hunderttausend Sequenzen und die bestehenden Bioinformatikverfahren erreichen keine ausreichende Datenabfragequalität.

Das Projekt PROMOS (Probabilistic models in pseudo-Euclidean spaces) adressierte diese Lücke über Bioinformatikansätze. Das Ziel war die Gestaltung von Algorithmen, die sehr schnell genaue Sequenzdaten von groß angelegten Datenbanken bereitstellen.

Zu Beginn wandten die Forscher generische, nicht metrische Ergebnisähnlichkeiten an, um datenspezifische probabilistische relationale Modelle abzuleiten und zu implementieren. Es wurde erfolgreich ein probabilistischer Rahmen für relationale Methoden in pseudo-euklidischen Räumen entwickelt.

Zur Verbesserung des Modelllernprozesses und zur Gewährleistung einer schnellen Datenabfrage wurden Approximationssysteme für relationale Daten sowie ein hierarchisches Modell und eine Abfragesystem entwickelt. Dieser domänenspezifische Ansatz ist effektiv, da Dissimilaritätsmatrizen im großen Maßstab bei linearen Kosten in approximierte positive semidefinite Kernelmatrizen konvertiert werden.

Die PROMOS-Technologie wurde an verschiedenen groß angelegten Proteindatenbanken getestet und zeigte eine bessere Laufzeitleistung als klassische Abfragesysteme mit einer wettbewerbsfähigen Modellgenauigkeit. Die Methoden sind in zahlreichen namhaften Publikationen veröffentlicht worden und mehrere weitere Publikationen sind in Vorbereitung.

Die Projektaktivitäten und -ergebnisse sollen die Forschung und Entwicklung in den Sektoren Biotechnologie und Pharmazeutik erheblich beschleunigen.

Verwandte Informationen

Fachgebiete

Scientific Research

Schlüsselwörter

Sequenzdaten, Bioinformatik, PROMOS, probabilistisches Modell, pseudo-euklidische Räume
Folgen Sie uns auf: RSS Facebook Twitter YouTube Verwaltet vom Amt für Veröffentlichungen der EU Nach oben