Forschungs- & Entwicklungsinformationsdienst der Gemeinschaft - CORDIS

Schluss mit falschen Übersetzungstechniken

Automatische Übersetzungsprogramme, bekannt als maschinelle Übersetzer, sind relativ neue Technologien. Trotzdem sie mittlerweile weit fortgeschritten sind, sind ihre Genauigkeit und vielseitige Anwendbarkeit fragwürdig. An einer spanischen Universität wurde nun ein maschinelles Übersetzungsprogramm entwickelt, das in Bezug auf diese beiden Aspekte sehr viel versprechend ist.
Schluss mit falschen Übersetzungstechniken
Die größten Schwierigkeiten beim Übersetzen bilden häufig technische Fachbegriffe und die verschiedenen kontextabhängigen Bedeutungen eines Wortes. Weiterhin werden in vielen Unternehmen sehr viele Übersetzungen benötigt, sodass der Zeitfaktor ebenfalls eine Rolle spielt.

Technologien für die Verarbeitung menschlicher Sprache stehen somit unter dem Druck, akkurate Übersetzungen in Rekordzeiten zu liefern. Die neue Technologie übersetzt etwa 10.000 Wörter pro Sekunde mit einer Genauigkeit von 85-90%.

Um dies zu erreichen, nutzen die Projektentwickler modulare Maschinen, die unabhängig voneinander an endlichen Techniken arbeiten. Diese endlichen Techniken sorgen für die erforderliche Schnelligkeit (erreichbar an einem normalen Bürocomputer). Anteil an diesem hohen geforderten Maß an Genauigkeit hat der Unicode, auf dem die Technologie aufgebaut ist. Unicode berücksichtigt das Rich Text Format (RTF) eines Textes, der Sonderzeichen enthalten kann, wie es zum Beispiel im Polnischen der Fall ist. Somit werden Inkompatibilitäten minimiert.

Zusätzliche Vorteile wie die quelloffene Kodierung und der einfache Anschluss an Internet-Technologien, die über keine maschinellen Übersetzungsprogramme verfügen, sorgen für die kommerzielle Machbarkeit dieses Produkts. Damit werden die Voraussetzungen geschaffen, um die Technologie besser an die Bedürfnisse des Einzelnen anzupassen. Außerdem werden die Verfahren zur Fehlerbehebung verbessert.

Das automatische Übersetzungsprogramm legt seinen Schwerpunkt vor allem auf Sprachen lateinischen Ursprungs (romanische Sprachen) und ist in der Lage, bestimmte und syntaktisch einfache Strukturen zu verarbeiten. Dazu gehören spezielle Funktionen wie Übereinstimmung von Zahl und Geschlecht, der Umgang mit Präpositionen und die korrekte Platzierung von Syntaxstrukturen.

Weiterhin bietet der neu entwickelte maschinelle Übersetzer auch Raum für Minderheitensprachpaare wie Okzitanisch, Korsisch und Sardisch. Zurzeit steht ein Prototyp für Tests zur Verfügung. Die Entwickler suchen Partner aus der Wirtschaft, der Forschung und aus Technologiezentren.
Datensatznummer: 82154 / Zuletzt geändert am: 2005-09-18
Bereich: IT, Telekommunikation