CORDIS - Forschungsergebnisse der EU
CORDIS

Common Language Resources and Technology Infrastructure

Article Category

Article available in the following languages:

Online-Tool für Sprache und Sprachverarbeitung

Europäische Forscher integrierten verfügbare digitale Daten über Sprache und Sprachverarbeitung in eine Online-Architektur, die sowohl Fachspezialisten als auch Geisteswissenschaftler ohne spezielle technische Vorkenntnisse nutzen können.

Gesundheit icon Gesundheit

Die Verwendung von Sprache unterscheidet den Menschen vom Tier. Ein besseres Verständnis der Struktur, Benutzung und Evolution von Sprache liefert neue Einblicke in verschiedenste Themenbereiche - von historischen Migrationsmustern bis hin zu Kriterien für Suchmaschinen im Internet. Die interdisziplinäre Sprachforschung umfasst Linguistik, Psychologie, neuronale Verarbeitung, Kognition, Informatik, Elektronik und Computertechnik bis hin zur Biomedizin und Mathematik. Europäische Geistes- und Sozialwissenschaftler (humanities and social sciences, HSS) wollten daher im Rahmen des Projekts CLARIN (Common language resources and technology infrastructure) eine einheitliche Infrastruktur zur Verarbeitung von Sprachdaten und Methoden der Sprachforschung schaffen. Der Schwerpunkt lag dabei weniger auf der Generierung neuen Wissens, sondern auf der Vereinheitlichung bereits vorhandener nationaler und europäischer Ressourcen. Hierfür sollte eine Infrastruktur für vorhandene Daten und Werkzeuge geschaffen werden, auf die die gesamte Forschergemeinschaft zugreifen kann. Mit der verteilten Datenarchitektur stehen sowohl Forschern als auch Laiennutzern Onlinedienste zur Verfügung, um Lösungen für komplexe Aufgaben zu finden und hierfür die Vielzahl der in den letzten Jahren entwickelten Methoden zur Sprachverarbeitung zu nutzen. Das unter http://www.clarin.eu/vlo/ abrufbare Virtual Language Observatory (VLO) stellte den Partner von CLARIN alle analysierten und zusammengefassten Daten zu Sprachdatenbanken und Werkzeugen zur Verfügung. In den Geistes- und Sozialwissenschaften ist der Umgang mit Linguistikprogrammen und Technologie vielen Forschern kaum vertraut, da dies bislang kein technologieorientierter Forschungsbereich war. Eines der wichtigen Ergebnisse des CLARIN-Projekts war daher, Zugang zu diesen Forschergemeinschaften zu gewinnen. Neben technischen Aspekten befasste sich Clarin auch mit Verwaltungs- und Finanzierungsmodellen für rechtliche, finanzielle und organisatorische Fragen. Für das Projekt wurden auf breiter Basis Geistes- und Sozialwissenschaftler engagiert, um die Grundlagen für eine einheitliche Infrastruktur für Sprachdatenbanken und Werkzeuge zu schaffen. Die Vielzahl an Daten und Werkzeugen erlaubt Wissenschaftlern nun Suchanfragen und Problemlösungsstrategien, die wegen limitierter Datenmengen und Technologien bislang nicht möglich waren. Die von Clarin entwickelte Infrastruktur ebnete damit den Weg für interessante Neuinterpretationen auf dem Gebiet von Spracherkennung und Sprachverarbeitung.

Entdecken Sie Artikel in demselben Anwendungsbereich