CORDIS - Forschungsergebnisse der EU
CORDIS

Article Category

Nachrichten
Inhalt archiviert am 2023-01-01

Article available in the following languages:

Europäisches DataGrid könnte bald Realität werden

Das europäische DataGrid (EDG)-Projekt, das Wissenschaftlern beispiellose Rechenleistung zur Antwort auf größere Herausforderungen wie Klimawandel-Modellierung oder die Analyse von Erbinformationen verspricht, hat einen wichtigen Schritt nach vorn gemacht. Ein weltweites Rech...

Das europäische DataGrid (EDG)-Projekt, das Wissenschaftlern beispiellose Rechenleistung zur Antwort auf größere Herausforderungen wie Klimawandel-Modellierung oder die Analyse von Erbinformationen verspricht, hat einen wichtigen Schritt nach vorn gemacht. Ein weltweites Rechnernetz ist mit der neuesten Version der Middleware - die Software zur nahtlosen Verbindung eines Grids (Gitter) von Computern - in greifbarere Nähe gerückt. Die Middleware unterstützt die Produktionsqualität des Grid-Rechnernetzes. Markus Schulz, einer der leitenden Softwareentwickler bei CERN, erläutert: "Mit dieser Version wird das EDG-Projekt aus dem Labor in die reale Welt geführt." Das europäische DataGrid ist ein von der Europäischen Union gefördertes Projekt. Es wird von CERN zusammen mit fünf Hauptpartnern sowie 15 assoziierten Partnern geleitet. An dem Projekt sind folgende führende europäische Forschungsbehörden beteiligt: die Europäische Weltraumorganisation (ESA), das Centre National de la Recherche Scientifique (CNRS, Frankreich), das Istituto Nazionale di Fisica Nucleare (INFN, Italien), das Nationaal Instituut voor Kernfysica en Hoge Energie Fysica (NIKHEF, Niederlande) sowie der Particle Physics and Astronomy Research Council (PPARC, Vereinigtes Königreich). Eins der Hauptziele des vor rund zwei Jahren gestarteten Projekts ist es, über die Phase der Forschung und Entwicklung (FuE) hinauszugehen und ein Rechnernetz von guter "Produktionsqualität" zu entwickeln. Produktionsqualität bedeutet nicht nur ein Nachweis für das Funktionieren des Prinzips, sondern den Einsatz einer stabilen Ressource, die die Wissenschaftler benötigen. Das Projekt baut auf die bereits für das EDG-Projekt entwickelte Software sowie etablierte Open Source-Lösungen auf. Ausgehend von Elementen eines Toolkits für die Entwicklung von Grid-Software (Globus 2.2) verbessert die neue Version die Unterstützung für größere Dateitransfers enorm und bietet eine bessere Verfolgung von im Grid ausgeführten Anwendungen sowie ein stabileres Informationssystem. Es wurden zahlreiche zentrale Funktionen wie ein vereinfachter Zugriff auf Massenspeichersysteme, ein unkomplizierterer Softwareinstallations-Mechanismus und benutzerfreundlichere Funktionen für die "Job Submission" (Start eines Jobs) für die Produktion integriert. Die Software wird gegenwärtig auf Hunderten von Computern installiert, die Bestandteil der Testumgebung für die EDG-Produktion bilden, eine der größten und intelligentesten Grid-Infrastrukturen, die weltweit entwickelt werden. Die Testumgebung beschränkte sich anfangs auf fünf europäische Länder und wurde kürzlich auf 20 Standorte in ganz Europa ausgedehnt, darunter Polen, die Tschechische Republik, Spanien, Portugal, Deutschland und nordische Länder. Die Interoperabilität mit der in den USA entwickelten Grid-Infrastruktur wurde ebenfalls demonstriert, und neue Standorte in Asien, Russland und Kanada werden bald in die Testumgebung aufgenommen. Verknüpfungen der unterschiedlichen europäischen Knoten werden durch das von der EU kofinanzierte GEANT-Projekt ermöglicht, ein führendes Datenkommunikations-Netzwerk, das über 30 Länder in ganz Europa bei Geschwindigkeiten von bis zu 10 Gigabits pro Sekunde verbindet. Im Rahmen des EDG-Projekts wird einer der ersten umfangreichen Produktionsqualitäts-Tests dieses beeindruckenden Netzwerks durchgeführt. EDG und GEANT arbeiten zusammen, um Probleme wie Geschwindigkeit, Zuverlässigkeit und Überwachungsfähigkeiten zu lösen, die durch die in der EDG-Testumgebung laufenden Anwendungen aufgeworfen werden. Die Testumgebung für die EDG-Produktion wird von der Wissenschaft genutzt, um Forschung in drei zentralen Bereichen zu betreiben: Erforschung der Genomik, Erdbeobachtung und Hochenergiephysik. In der Hochenergiephysik nutzen die bei CERN beschäftigten Physiker die Grid-Technologie, um die enormen Datenmengen bearbeiten zu können, die anfallen, wenn der Large Hadron Collider (LHC - großer Speicherring) - das leistungsfähigste Instrument zur Erforschung der Materieeigenschaften überhaupt - an den Start geht. Die LHC-Tests werden jedes Jahr rund 10 Petabytes an Datenmenge generieren. Dies entspricht 16 Millionen CD-Roms und stellt eine große Herausforderung hinsichtlich der Speicherung und Analyse der enormen Datenmenge dar. Professor Alois Putzer von der Universität Heidelberg, der Verantwortliche für die Organisation des weltweiten Rechnernetzes für das Atlas-Experiment im LHC, führt aus: "Wir sind sehr erfreut darüber, dass das EDG-Projekt bereits eine Produktionsqualität basierend auf der Grid-Middleware erlaubt. Dadurch können wir unsere extremen Rechneranforderungen jetzt in einer realen Grid-Infrastruktur regelmäßig testen, und es könnte erhebliche Auswirkungen darauf haben, wie wir unser weltweit verteiltes Rechenzentrum und den Datenzugriff planen."