3. Dezember 2018
Ein von Salk-Wissenschaftlern entdecktes neues Framework könnte die Methoden des maschinellen Lernens verbessern oder dabei helfen, zu erkennen, wenn die Erkennung von Neuheiten im Gehirn beeinträchtigt ist
LA JOLLA – Es mag den Anschein haben, als hätten Fruchtfliegen nichts mit Computern gemein, aber neue Untersuchungen des Salk Institute zeigen, dass die beiden neuartige Informationen auf ähnliche Weise identifizieren. Das Werk, das in erschien Verfahren der National Academy of Sciences (PNAS) am 3. Dezember 2018 wirft nicht nur Licht auf ein wichtiges neurobiologisches Problem – wie Organismen neue Gerüche erkennen – sondern könnte auch Algorithmen zur Neuheitserkennung in der Informatik verbessern.
„Wenn eine Fliege einen Geruch riecht, muss die Fliege schnell herausfinden, ob sie den Geruch schon einmal gerochen hat, um festzustellen, ob der Geruch neu ist und ob sie etwas beachten sollte“, sagt er Saket Navlakha, Assistenzprofessor am Integrative Biology Laboratory von Salk und Mitautor des Artikels. „In der Informatik ist dies eine wichtige Aufgabe, die als Neuheitserkennung bezeichnet wird. Wenn wir verstehen, wie sich Strategien zur Neuheitserkennung in beiden Bereichen vergleichen, könnten wir wertvolle Erkenntnisse sowohl über Gehirnalgorithmen als auch über Computer gewinnen.“ Die Forscher vermuten, dass ihr neues Framework bei der Erkennung von Duplikaten oder Anomalien in großen Streaming-Datensätzen wie Patientendatenbanken oder Nachrichtenmeldungen nützlich sein könnte.
Im Jahr 2017 entdeckte Navlakha, wie Gehirne fliegen identifizieren ähnlich Gerüche. Er fand heraus, dass die Anwendung des Fly-Algorithmus auf Computer-„Ähnlichkeitssuchen“ (z. B. solche, die Produkte zum Kauf vorschlagen, die Ihren früheren Käufen ähneln) die Suchergebnisse verbesserte.
The new PNAS Die Studie basiert auf einem anderen Artikel [Hattori et al.], der 2017 in der Zeitschrift veröffentlicht wurde Zelleund beschreibt, wie Fliegen völlig neue Gerüche wahrnehmen. Als Navlakha die Studie las, war er beeindruckt, wie die Fliegen offenbar eine Taktik verwendeten, die einem Rechenwerkzeug zur Erkennung von Neuheiten ähnelte, das als Bloom-Filter bezeichnet wird.
Wenn eine Suchmaschine wie Google das Web crawlt, muss sie wissen, ob eine Website, auf die sie stößt, bereits zuvor indiziert wurde, damit sie keine Zeit damit verschwendet, dieselbe Website erneut zu indizieren. Das Problem besteht darin, dass es Billionen von Websites im Web gibt und deren Speicherung im Speicher rechenintensiv ist. In den 1970er Jahren entwickelte Howard Bloom am MIT eine Datenstruktur, die eine große Datenbank mit Elementen kompakt speichern kann. Anstatt jedes Element in seiner Gesamtheit in der Datenbank zu speichern, speichert ein Bloom-Filter einen kleinen „Fingerabdruck“ jedes Elements und benötigt dabei nur wenige Bits Platz pro Element. Durch die Überprüfung, ob derselbe Fingerabdruck zweimal in der Datenbank vorkommt, kann ein System schnell feststellen, ob es sich bei dem Objekt um ein Duplikat oder um etwas Neues handelt.
Es ist bekannt, dass Fruchtfliegen ihr Verhalten als Reaktion auf neuartige Gerüche ändern. Eine Region im Fliegenhirn, der sogenannte Pilzkörper, enthält eine Ansammlung von Neuronen, die Geruchsinformationen verarbeiten. Wenn ein neuer Geruch wahrgenommen wird, senden diese Neuronen ein „Neuheitsalarm“-Signal, damit die Fliege weiß, dass dieser Geruch neu ist und eine Untersuchung wert ist. Wenn der Geruch jedoch keine starke Wirkung hat, verringert sich die Stärke des Alarmsignals beim nächsten Mal, wenn der Geruch wahrgenommen wird, und die Fliege verschwendet keine Zeit mit der Untersuchung des Geruchs. Dies ist eine wichtige Berechnung, da die Fliege nur dann auf etwas achten möchte, wenn es sich lohnt. Das Neuheitssignal des Pilzkörpers der Fliege wird mithilfe eines Fingerabdrucks für Gerüche erzeugt, der dem „Datenfingerabdruck“ des Bloom-Filters ähnelt.
„Eine grundlegende Herausforderung beim maschinellen Lernen besteht darin, Darstellungen von Daten zu finden, die für eine Vielzahl von Aufgaben geeignet sind“, sagt Sanjoy Dasgupta, Professor für Informatik und Ingenieurwissenschaften an der UC San Diego und Erstautor der neuen Arbeit. „Das Geruchssystem der Fliege zeigt uns einen einfachen und genialen Weg, dies zu tun.“
Durch die Analyse – aus der Sicht der Informatik – des im Cell-Artikel identifizierten neuronalen Schaltkreises, der dieses neuartige Signal erzeugt, fanden Navlakha und Dasgupta heraus, dass die Fruchtfliege ein paar neue Wendungen in den traditionellen Bloom-Filter einführte, den ihr Team ausarbeitete und mathematisch definiert.
Bei der ersten Wendung geht es nicht nur darum, festzustellen, ob Sie schon einmal genau den gleichen Geruch gerochen haben, sondern vielmehr, ob Sie den Geruch oder etwas ziemlich Ähnliches gerochen haben. Dies ist für das Gehirn wichtig, da die Wahrscheinlichkeit groß ist, dass Sie nie den exakt gleichen Geruch zweimal riechen. Die zweite Wendung besteht darin, festzustellen, wie lange es her ist, dass Sie den Geruch gerochen haben. Wenn es schon lange her ist, sollte der Geruch neuartiger sein, als wenn Sie den Geruch erst vor Kurzem gerochen haben.
Basierend auf der Bloom-Filtervariante der Fruchtfliege erstellte das Team ein neues algorithmisches Framework, um die Neuheitsreaktionen von Fruchtfliegen vorherzusagen. Sie testeten ihr Framework anhand von Forschungsdaten, die gesammelt wurden, als Fliegen nacheinander Geruchspaare präsentiert wurden. Es stellte sich heraus, dass die Neuheitsvorhersagen des Teams weitgehend mit der tatsächlichen Neuheitsreaktion der Pilzkörperneuronen übereinstimmten, was die Genauigkeit ihres Rahmenwerks bestätigte. Anschließend testete Navlakhas Team das Framework anhand mehrerer Datensätze für maschinelles Lernen und stellte fest, dass der Bloom-Filter der Fliege die Genauigkeit der Neuheitserkennung im Vergleich zu anderen Arten von Neuheitserkennungsfiltern verbesserte.
Navlakha fügt hinzu: „Was diese Arbeit für uns besonders spannend macht, ist, dass sie eine der ersten im Gehirn entdeckten Datenstrukturen darstellt, zusammen mit einem einfachen Algorithmus dafür, wie das Gehirn tatsächlich die Erkennung von Neuheiten durchführen kann.“
Die Arbeit wurde von den Pew Charitable Trusts, dem Kavli Institute for Brain and Mind und dem NIDCD der National Institutes of Health unter der Fördernummer 1R01DC017695 finanziert.
Weitere Autoren waren Timothy C. Sheehan von der UC San Diego und Charles F. Stevens von Salk.
JOURNAL
Verfahren der National Academy of Sciences (PNAS)
AUTOREN
Sanjoy Dasgupta, Timothy C. Sheehan, Charles F. Stevens und Saket Navlakha
Büro für Kommunikation
Tel: (858) 453-4100
press@salk.edu
Die Geheimnisse des Lebens selbst zu entschlüsseln, ist die treibende Kraft hinter dem Salk Institute. Unser Team aus erstklassigen, preisgekrönten Wissenschaftlern verschiebt die Grenzen des Wissens in Bereichen wie Neurowissenschaften, Krebsforschung, Alterung, Immunbiologie, Pflanzenbiologie, Computerbiologie und mehr. Das von Jonas Salk, dem Entwickler des ersten sicheren und wirksamen Polio-Impfstoffs, gegründete Institut ist eine unabhängige, gemeinnützige Forschungsorganisation und ein architektonisches Wahrzeichen: klein durch Wahl, intim von Natur aus und furchtlos angesichts jeder Herausforderung.