8. Juni 2017
Eine neue Arbeit des Salk Institute, die den visuellen Prozess des Gehirns beschreibt, könnte selbstfahrende Autos verbessern und auf Therapien für sensorische Beeinträchtigungen hinweisen
Eine neue Arbeit des Salk Institute, die den visuellen Prozess des Gehirns beschreibt, könnte selbstfahrende Autos verbessern und auf Therapien für sensorische Beeinträchtigungen hinweisen
LA JOLLA – Wenn Sie denken, dass selbstfahrende Autos nicht früh genug kommen können, sind Sie nicht allein. Aber die Programmierung von Computern zur Erkennung von Objekten ist technisch sehr anspruchsvoll, insbesondere weil Wissenschaftler nicht vollständig verstehen, wie unser eigenes Gehirn dies tut.
Jetzt haben Forscher des Salk Institute analysiert, wie Neuronen in einem kritischen Teil des Gehirns, V2 genannt, auf natürliche Szenen reagieren, und so ein besseres Verständnis der Sehverarbeitung ermöglicht. Die Arbeit ist beschrieben in Nature Communications veröffentlicht Juni 8, 2017.
„Zu verstehen, wie das Gehirn visuelle Objekte erkennt, ist nicht nur für das Sehen wichtig, sondern auch, weil es einen Einblick in die Funktionsweise des Gehirns im Allgemeinen bietet“, sagt er Tatyana Sharpee, außerordentlicher Professor am Computational Neurobiology Laboratory von Salk und leitender Autor des Artikels. „Ein Großteil unseres Gehirns besteht aus einer sich wiederholenden Recheneinheit, der sogenannten kortikalen Säule. Insbesondere im Sehbereich können wir Eingaben ins Gehirn mit äußerster Präzision steuern, was es ermöglicht, quantitativ zu analysieren, wie Signale im Gehirn umgewandelt werden.“
Obwohl wir die Fähigkeit zu sehen oft als selbstverständlich betrachten, beruht diese Fähigkeit laut Sharpee auf einer Reihe komplexer mathematischer Transformationen, die wir noch nicht in einem Computer reproduzieren können. Tatsächlich ist mehr als ein Drittel unseres Gehirns ausschließlich der Aufgabe gewidmet, visuelle Szenen zu analysieren.
Unsere visuelle Wahrnehmung beginnt im Auge mit hellen und dunklen Pixeln. Diese Signale werden an die Rückseite des Gehirns an einen Bereich namens V1 gesendet, wo sie so umgewandelt werden, dass sie den Kanten in den visuellen Szenen entsprechen. Irgendwie können wir dann durch mehrere aufeinanderfolgende Transformationen dieser Informationen Gesichter, Autos und andere Objekte erkennen und erkennen, ob sie sich bewegen. Wie genau diese Erkennung geschieht, ist immer noch ein Rätsel, unter anderem weil Neuronen, die Objekte kodieren, auf komplizierte Weise reagieren.
Jetzt haben Sharpee und Ryan Rowekamp, ein Postdoktorand in Sharpees Gruppe, eine statistische Methode entwickelt, die diese komplexen Reaktionen auf interpretierbare Weise beschreibt und dabei helfen könnte, das Sehen für computersimuliertes Sehen zu entschlüsseln. Um ihr Modell zu entwickeln, nutzte das Team öffentlich verfügbare Daten aus der Datenbank Collaborative Research in Computational Neuroscience (CRCNS), die die Gehirnreaktionen von Primaten zeigen, die sich Filme mit natürlichen Szenen (z. B. Waldlandschaften) anschauen.
„Wir haben unsere neue statistische Technik angewendet, um herauszufinden, welche Merkmale im Film dazu führten, dass V2-Neuronen ihre Reaktionen änderten“, sagt Rowekamp. „Interessanterweise stellten wir fest, dass V2-Neuronen auf Kantenkombinationen reagierten.“
Das Team stellte fest, dass V2-Neuronen visuelle Informationen nach drei Prinzipien verarbeiten: Erstens kombinieren sie Kanten mit ähnlicher Ausrichtung und erhöhen so die Robustheit der Wahrnehmung gegenüber kleinen Änderungen in der Position von Kurven, die Objektgrenzen bilden. Zweitens: Wenn ein Neuron durch eine Kante mit einer bestimmten Ausrichtung und Position aktiviert wird, ist die Ausrichtung im 90-Grad-Winkel davon an derselben Stelle unterdrückend, eine Kombination, die als „Kreuzorientierungsunterdrückung“ bezeichnet wird. Diese kreuzorientierten Kantenkombinationen werden auf verschiedene Weise zusammengesetzt, um es uns zu ermöglichen, verschiedene visuelle Formen zu erkennen. Das Team stellte fest, dass die Kreuzausrichtung für eine genaue Formerkennung unerlässlich ist. Das dritte Prinzip besteht darin, dass relevante Muster im Raum auf eine Weise wiederholt werden, die dazu beitragen kann, strukturierte Oberflächen von Bäumen oder Wasser und Grenzen zwischen ihnen wahrzunehmen, wie in impressionistischen Gemälden.
Die Forscher integrierten die drei Organisationsprinzipien in ein Modell, das sie „Quadratisches Faltungsmodell“ nannten und das auf andere Sätze experimenteller Daten angewendet werden kann. Die visuelle Verarbeitung ähnelt wahrscheinlich der Art und Weise, wie das Gehirn Gerüche, Berührungen oder Geräusche verarbeitet, sagen die Forscher, sodass die Arbeit auch die Verarbeitung von Daten aus diesen Bereichen aufklären könnte.
„Modelle, an denen ich zuvor gearbeitet hatte, waren nicht vollständig oder nicht sauber mit den Daten kompatibel“, sagt Rowekamp. „Es war wirklich befriedigend, als sich die Idee, Kantenerkennung mit Texturempfindlichkeit zu kombinieren, als Werkzeug zur Analyse und zum Verständnis komplexer visueller Daten auszuzahlen begann.“
Die unmittelbarere Anwendung könnte jedoch darin bestehen, Objekterkennungsalgorithmen für selbstfahrende Autos oder andere Robotergeräte zu verbessern. „Es scheint, dass jedes Mal, wenn wir Rechenelemente, die im Gehirn vorkommen, zu Computer-Vision-Algorithmen hinzufügen, ihre Leistung verbessert“, sagt Sharpee.
Die Arbeit wurde gefördert durch die National Science Foundation und der Nationales Augeninstitut.
JOURNAL
Nature Communications veröffentlicht
AUTOREN
Tatyana O. Sharpee und Ryan J. Rowekamp
Büro für Kommunikation
Tel: (858) 453-4100
press@salk.edu
Die Geheimnisse des Lebens selbst zu entschlüsseln, ist die treibende Kraft hinter dem Salk Institute. Unser Team aus erstklassigen, preisgekrönten Wissenschaftlern verschiebt die Grenzen des Wissens in Bereichen wie Neurowissenschaften, Krebsforschung, Alterung, Immunbiologie, Pflanzenbiologie, Computerbiologie und mehr. Das von Jonas Salk, dem Entwickler des ersten sicheren und wirksamen Polio-Impfstoffs, gegründete Institut ist eine unabhängige, gemeinnützige Forschungsorganisation und ein architektonisches Wahrzeichen: klein durch Wahl, intim von Natur aus und furchtlos angesichts jeder Herausforderung.