Übersetzen großer Mengen Pflanzengenomdaten

Informationen zu Pflanzengenomen sind von größter Bedeutung für die Weiterentwicklung der Forschung in den Bereichen Landwirtschaft und Umwelt. Da die aus Experimenten gewonnenen Informationen äußerst komplex sind, hat das PLANET-Projekt eine allgemeine Open Source-Lösung für die Extraktion relevanter biologischer Fakten aus verfügbaren Wissensquellen vorgeschlagen.

Digitale Wirtschaft

Die vollständige Sequenzierung des Arabidopsis-Genoms und die großen Sammlungen anderer Pflanzensequenzen, die in den letzten Jahren gesammelt wurden, haben zu umfassenden Forschungsarbeiten in der funktionellen Genomik geführt. Die Nutzung dieser Daten ist jedoch ineffizient, da Datensammlungen in der Molekularbiologie verteilt und heterogen und Versuche einer umfassenden Integration zeitaufwendig sind. Ultimatives Ziel des PLANET-Projektes war die Überwindung der Einschränkungen individueller Projekte und unabhängiger Sammlungen molekularbiologischer Daten. Im Gegensatz zu vielen anderen Ansätzen zur Datenspeicherung haben die PLANET-Projektpartner keine Lösung mit einem Datenlager vorgeschlagen, in dem alle Daten zur Kartierung von Pflanzengenomen in einer einzigen Datenbank zusammengefasst werden. Stattdessen wurden Webtechnologien für den Zugriff auf aktuelle Datensätze entwickelt, die weiterhin verteilt bei den entsprechenden Spezialisten verbleiben. YAdumper wurde von Projektpartnern des spanischen National Research Council als zweckgebundenes Tool für das Herunterladen strukturierter Informationen aus verteilten Datenbanken entwickelt. Die Java-Anwendung stellt keine Vermutungen zu den Eigenschaften der Datenbank an. Sie erfordert als Eingabe einen Satz globaler Variablen, die Formatierungsfunktionen und den Namen der Ausgabedatei (XML oder vergleichbares Format). Die Vorlagendatei ist die einzige dauerhaft gespeicherte Datei. YAdumper verringert jedoch nicht nur die Speicheranforderungen. Da Anfragen an mehrere Datenbanken gesendet und korrelierte Anfragen verwendet werden können, ermöglicht die Anwendung das Abrufen Tausender verwandter Zeilen aus Datenbanken der Molekularbiologie. YAdumper ist nur eine der im Rahmen des PLANET-Projektes entwickelten Webtechnologien und trägt zur systematischen Erforschung des Arabidopsis- und weiterer Pflanzengenome bei.