CORDIS - Forschungsergebnisse der EU
CORDIS

Visual perception in deep neural networks

Article Category

Article available in the following languages:

Besseres maschinelles Sehen dank menschlicher Modellierung

Sollten Maschinen jemals richtig sehen können, dann kann es sein, dass das Ganze mit der Arbeit eines EU-Teams an der Modellierung der Funktionsweise echter Gehirne seinen Anfang genommen hat.

Digitale Wirtschaft icon Digitale Wirtschaft

Das Sehvermögen des Menschen ist das Ergebnis sehr komplexer neurologischer Prozesse, die durch ein ganzes Sammelsurium spezialisierter, aber relativ einfacher, zusammenwirkender Gehirnmodule erreicht werden. Etwas Ähnliches kann im Computer reproduziert werden, was ihm eine Art Sehvermögen verleiht. Diese Anwendung ist nicht neu und wurde schon in verschiedenen Industriesektoren wie zum Beispiel bei Sicherheitssystemen oder auch autonomen Raumfahrzeugen und Autos ausprobiert. Systeme dieser Art haben jedoch ihre Grenzen und können in neuartigen Situationen komplett versagen. Verfügt beispielsweise ein selbstfahrendes Fahrzeug nicht über visuelle Wüstendaten, kann es Schwierigkeiten haben, sein Wissen über städtische Landschaften auf diese Umgebung anzuwenden. In diesem Fall kommt beim Fahrzeug Verwirrung auf und es neigt zu Fehlern. So ist der Weg zu einem wirklich zuverlässigen und autonomen maschinellen Sehen noch weit. Neben den naheliegenden Anwendungen für Maschinen, verbessern die Untersuchungen zum maschinellen Sehen auch das Wissen über die Funktionsweise des Sehens beim Menschen. Das EU-finanzierte Projekt DEEPCEPTION, das mit Unterstützung der Marie-Skłodowska-Curie-Maßnahmen durchgeführt wurde, hat sich mit beiden Seiten des Problems beschäftigt. Das Projektforschungsteam entwickelte Modelle des maschinellen Sehens, welche die Prozesse im menschlichen Gehirn nachahmen und veranschaulichen.

Tiefe neuronale Netze

Neuronale Netze sind von biologischen Systemen inspiriert, denn ein Netz aus Computerprozessoren funktioniert hier analog zu den Neuronen (Gehirnzellen). In Netzen dieser Art dienen Algorithmen der Mustererkennung, ohne dass sie speziell dafür programmiert sind. In einem „tiefen neuronalen Netz“, auf das sich das Projektkonzept stützt, herrschen ähnliche Verhältnisse, es beinhaltet jedoch außerdem viele Verarbeitungsschichten und es wird auf eine bestimmte Aufgabe trainiert. Die Aufgabe von DEEPCEPTION lautete, den Computern beizubringen, Objekte auf Fotografien zu erkennen. Die Forschenden verglichen die Reaktionen des tiefen neuronalen Netzes mit denen echter Primatengehirne (Affe und Mensch) beim Betrachten derselben Bilder. „Sollte das Computermodell den realen biologischen Prozess genau wiedergeben, dann sollten auch die Reaktion des neuronalen Netzes und des Gehirns übereinstimmen“, erläutert Projektleiter Jonas Kubilius. Das Forschungsteam hat Benchmarks entwickelt, die eine Bewertung und Quantifizierung der Übereinstimmung dieser beiden Prozesse zulässt. Die integrative neuronale und verhaltenswissenschaftliche Benchmark-Plattform Brain-Score des Teams ist die bislang weltweit umfangreichste ihrer Art. Auf der Grundlage der aus diesem Vergleich gewonnenen Erkenntnisse erstellte das Forschungsteam dann das Computermodell CORnet, das bei den Benchmarks sehr gut abschnitt.

Das genaueste Modell

Gegenwärtig können nur wenige Modelle des menschlichen Sehens eine neuronale oder verhaltensbezogene Reaktion präzise vorhersagen. Das Modell von DEEPCEPTION übertrifft kompliziertere Systeme des maschinellen Sehens und verkörpert nun das derzeit beste Verständnis darüber, wie die Objekterkennung im visuellen System von Primaten funktioniert. „Ich war sehr stolz, als unser Modell die neuronalen Reaktionen auf einem völlig neuen Datensatz vorhersagen konnte“, fügt Kubilius hinzu. „Versuche dieser Art anhand neuer Daten sind ein sicheres Mittel zur Verfälschung von Modellen.“ Ist ein Modell nicht in der Lage, etwas vorherzusagen, was über die Daten hinausgeht, an denen es trainiert wurde, dann bedeutet das, dass das Modell kein echtes Verständnis repräsentiert. Trifft ein Modell jedoch gute Vorhersagen für einen völlig neuen Datensatz, so ist dies ein positives Zeichen dafür, dass das Modell genau ist. Das Projekt hat ein verbessertes Modell des Sehvermögens von Primaten hervorgebracht. Auch wenn DEEPCEPTION keine kommerziellen Ziele verfolgte, werden die hier entwickelten Werkzeuge den eigenen und anderen Forscherinnen und Forschern eine Hilfe dabei sein, noch genauere Modelle zu entwickeln.

Schlüsselbegriffe

DEEPCEPTION, Sehen, neuronales Netz, Maschine, tiefes neuronales Netz, Primat, maschinelles Sehen, Modellierung, menschliches Gehirn, Brain-Score, CORnet

Entdecken Sie Artikel in demselben Anwendungsbereich