Neuartige, nutzergesteuerte Plattform teilt und nutzt Daten aus der computergestützten Materialwissenschaft
Grundsätzlich hängt jedes neue kommerzielle Produkt, sei es im Bereich Gesundheit, Kommunikationstechnologie oder saubere Energie, weitgehend von verbesserten, neuen oder sogar neuartigen Materialien ab. Ihre Entdeckung ist bis heute eine der aufregendsten und wirtschaftlich wichtigsten Anwendungen im Hochleistungsrechnen. Big Data bietet ein bahnbrechendes Potenzial für zahlreiche Anwendungen und verspricht Durchbrüche bei der Verbesserung der Analyse und Beschreibung wissenschaftlicher Phänomene und Materialeigenschaften. Um das Potenzial dieser wichtigen Informationen und riesigen Mengen verfügbarer Daten vollständig auszuschöpfen, sind geeignete Infrastrukturen für eine effiziente Sammlung, Verwaltung und gemeinsame Nutzung erforderlich. Im Rahmen des EU-finanzierten Projekts NoMaD wurden Tools eingeführt, die es Forschern aus den Bereichen der Grundlagenforschung und Ingenieurwissenschaften ermöglichen, die Materialforschung voranzutreiben, neue physikalische Phänomene zu identifizieren, der Industrie zu helfen, vorhandene Produkte zu verbessern, sowie neuartige Produkte und Technologien zu entwickeln. „Damit ermöglichte NoMaD eine Veränderung der wissenschaftlichen Denkweise hin zu einem umfassenden Datenaustausch entsprechend den FAIR-Prinzipien (FAIR: Findable, Accessible, Interoperable, Reusable, d. h. die Daten müssen auffindbar, zugänglich, interoperabel und wiederverwendbar sein)“, so Projektkoordinator Prof. Matthias Scheffler. „Dies wird neue Wege für die Gewinnung und Veredelung von Big Data in der Materialwissenschaft eröffnen.“ Neuartige Tools zur Entdeckung, Schaffung und Verwendung neuer Materialien Das von NoMaD eingerichtete und verwaltete Verzeichnis ist nun das weltweit größte seiner Art für die computergestützte Materialwissenschaft, das auch Daten internationaler Forscher und anderer Datenbanken umfasst. Es enthält die Eingabe- und Ausgabedateien mehrerer Millionen hochwertiger Berechnungen, mit einer steigenden Tendenz an zur Verfügung gestellten Dateien. Im Gegensatz zu anderen Verzeichnissen ist es nicht auf ausgewählte Computercodes beschränkt, sondern dient der gesamten Gemeinschaft, indem alle wichtigen und derzeit in der computergestützten Materialwissenschaft gängigen Codes unterstützt werden. Durch das Hosten von Rohdaten und die kostenlose Aufbewahrung wissenschaftlicher Daten für mindestens zehn Jahre hilft das Verzeichnis Forschern, ihre Daten zu hosten, zu organisieren und auf sehr effiziente Weise für Dritte zugänglich zu machen. Darüber hinaus erstellten die Projektpartner ein Archiv, um die frei zugänglichen Daten des Verzeichnisses zu hosten, die in ein allgemeines, Code-unabhängiges Format konvertiert wurden. Sie entwickelten zahlreiche Parser, die alle in den Eingabe- und Ausgabedateien enthaltenen Informationen auslesen und übersetzen. Dadurch wird sichergestellt, dass Daten aus verschiedenen Quellen mit diversen NoMaD-Tools verglichen und gemeinsam bearbeitet werden können. Das Projektteam entwickelte auch mehrere Tools für die Auswertung der umfangreichen Archivdaten. Mit der Enzyklopädie können Nutzer die ermittelten Materialdaten anzeigen, vergleichen, untersuchen und verstehen. Sie kann zudem verwendet werden, um nach den Eigenschaften einer Vielzahl von Materialien zu suchen. Das Analyse-Toolkit bietet eine Sammlung von Beispielen und Tools, die zeigen sollen, wie Materialdaten in Wissen umgewandelt werden können. Schließlich erarbeiteten die Teammitglieder Tools, die eine Fernvisualisierung der mehrdimensionalen NoMaD-Daten über eine dedizierte Infrastruktur zulassen. Mithilfe eines zentralen Dienstes können Nutzer interaktiv umfassende Datenvisualisierungsaufgaben auf ihren Computern ausführen, ohne dass spezielle Hardware- oder Softwareinstallationen erforderlich sind. „NoMaD hat wesentlich zum Aufbau einer nachhaltigen und zuverlässigen Infrastruktur für eine effiziente Datensammlung und gemeinsame Datennutzung beigetragen“, schließt Prof. Scheffler. Letztendlich wird die Optimierung der Suche nach verbesserten bzw. neuen Materialien spürbare Auswirkungen auf das Materialdesign in Schlüsselbereichen wie Gesundheit, Umwelt, Schwerindustrie, saubere Energie, Mobilität und IKT haben.
Schlüsselbegriffe
NoMaD, Daten, Materialwissenschaft, neue Materialien, Big Data, Archiv