Skip to main content
CORDIS - Forschungsergebnisse der EU
CORDIS

Integrated and Detailed Image Understanding

Article Category

Article available in the following languages:

Wie die künstliche Intelligenz lernt, eigenständig zu lernen

Neue Algorithmen verfolgen das Ziel, künstliche Intelligenz mit der Fähigkeit auszustatten, Objekte nicht nur zu erkennen, sondern auch zu interpretieren, was sie erkennt.

Digitale Wirtschaft icon Digitale Wirtschaft

Wir Menschen verlassen uns in so gut wie allem auf unsere Augen, nehmen diese Fähigkeit aber oft als selbstverständlich hin. Doch die Fähigkeit, aus einem Bild Informationen zu gewinnen, ist in Wirklichkeit ein ungemein komplexer Vorgang. Einigen Forschenden zufolge nimmt das Sehvermögen sogar rund die Hälfte unserer Gehirnleistung in Anspruch. „Dieser komplexe Vorgang ermöglicht es uns, nicht nur ein Auto zu sehen, sondern ein blaues Auto; nicht nur einen Menschen, sondern einen Mann in einem roten T-Shirt“, so Andrea Vedaldi, Professor für maschinelles Sehen und Lernen an der Universität Oxford. Dieses nuancierte Verständnis des Gesehenen ist laut Vedaldi eine Grundvoraussetzung für die Entscheidungsfindung. „Wenn wir eine rote Ampel sehen und ein anderes Fahrzeug, das nicht abbremst, interpretieren wir diese Situation sofort als potenzielle Gefahr und handeln entsprechend“, ergänzt er. Und genau hier liegt das Hauptproblem bei künstlicher Intelligenz (KI). Die KI kann Objekte zwar recht souverän identifizieren, ist aber nicht in der Lage, das Gesehene zu interpretieren. Das kann bei Anwendungen wie autonomen Fahrzeugen oder Drohnen ohne Piloten zu erheblichen Problemen führen. „Während Babys – mit sehr wenig oder ganz ohne Einflüsse von außen – von alleine lernen, Bilder zu verstehen, muss das der KI erst durch eine umfassende und detaillierte manuelle Überwachung beigebracht werden“, erklärt Vedaldi. Mit Unterstützung des EU-finanzierten Projektes IDIU arbeitet Vedaldi mit seinem Forschungsteam nun genau daran. „Unser Ziel war es, eine neue Generation von Algorithmen zur Bildinterpretation zu entwickeln, die in ihrer Leistungsfähigkeit und Flexibilität näher an das menschliche Sehvermögen herankommen“, merkt er an.

Überwachung überflüssig

Das Projekt IDIU, das vom Europäischen Forschungsrat (ERC) unterstützt wurde, geht auf eines der Hauptprobleme in der modernen maschinellen Bilderkennung ein: die Notwendigkeit der Überwachung. Algorithmen können zwar durchaus lernen, komplexe Bildanalyseaufgaben zu lösen. Doch dafür müssen sie zunächst mit Tausenden – wenn nicht sogar Millionen – von gekennzeichneten Beispielen gefüttert werden. Dabei handelt es sich im Wesentlichen um Bilder, auf denen die entsprechende Interpretation manuell vermerkt ist. Das ist natürlich mit einem erheblichen Aufwand verbunden. Um das Verfahren zu rationalisieren, entwickelten die Forschenden mehrere neue Technologien – darunter Algorithmen, die „eigenständig forschen“ können. Das ist möglich, indem diese Algorithmen automatisch auf Internetressourcen wie Google und Wikipedia zugreifen und einen neuen mathematischen Ansatz nutzen, um die Geometrie von Objekten in Bildern und Videos ohne Überwachung von außen zu erlernen. „Wir konnten erstmals zeigen, dass die räumliche Struktur von Objekten durch reine Betrachtung von Bildern und ohne externe Überwachung erlernbar ist“, so Vedaldi. „Mit anderen Worten, ein Algorithmus kann von alleine lernen, dass ein Mensch zwei Arme, zwei Beine und eine bestimmte Körperhaltung hat.“

Menschenähnliche Flexibilität

Zwar ist die KI noch weit davon entfernt, an die menschliche Intelligenz heranzureichen, doch die Entwicklungen des Projektes IDIU ermöglichen nun immerhin eine Flexibilität auf menschlichem Niveau. „Mit der Einführung eines neuen Teilgebiets der KI, das wir internes Lernen nennen, wird dieses Projekt erheblichen Einfluss auf die künftige Forschung und die Industrie haben“, ergänzt er. Dieser Einfluss ist bereits jetzt zu spüren: Die Ergebnisse des Projekts werden bereits im Rahmen eines ERC Conslidator Grant genutzt. „Auf der Grundlage der IDIU-Erkenntnisse entwickeln wir nun Maschinen, die durch die passive Erfassung von zufällig aufgenommenen Bildern und Videos lernen können, völlig automatisch zu sehen“, so Vedaldi abschließend. „Wir rechnen damit, dass diese Technologie den Einsatz von maschinellem Sehen deutlich erleichtern und damit auch wesentlich mehr Flexibilität und Nutzen für viele wichtige Anwendungen von morgen bieten wird.“

Schlüsselbegriffe

IDIU, künstliche Intelligenz, KI, Algorithmen, maschinelles Sehen, maschinelles Lernen

Entdecken Sie Artikel in demselben Anwendungsbereich