目で見たものを脳がどのように認識するか

ソークニュース

2017 年 6 月 8 日

目で見たものを脳がどのように認識するか

脳の視覚プロセスを概説するソーク研究所の新たな研究は自動運転車を改善し、感覚障害の治療法を示唆する可能性がある

2017 年 6 月 8 日

ラホラ-自動運転車がすぐには実現しないと思っているのは、あなただけではありません。しかし、特に科学者が私たち自身の脳がどのように認識するかを完全には理解していないため、物体を認識するようにコンピューターをプログラミングすることは技術的に非常に困難です。

今回、ソーク研究所の研究者らは、V2と呼ばれる脳の重要な部分のニューロンが自然の光景にどのように反応するかを分析し、視覚処理についての理解を深めることができました。作品については、 ネイチャー·コミュニケーションズ 6月8、2017ます。

「脳が視覚的な物体をどのように認識するかを理解することは、視覚のためだけでなく、一般的に脳がどのように機能するかを理解するための窓となるので重要です」と彼は言います。タチアナ・シャープー、ソークの計算神経生物学研究所の准教授であり、論文の上級著者です。「私たちの脳の大部分は、皮質柱と呼ばれる反復的な計算単位で構成されています。特に視覚では、脳への入力を極めて正確に制御できるため、脳内で信号がどのように変換されるかを定量的に分析することが可能になります。」

シャーピー氏によると、私たちは見る能力を当たり前のことだと思っていますが、この能力は、コンピューターではまだ再現できない一連の複雑な数学的変換に由来しています。実際、私たちの脳の XNUMX 分の XNUMX 以上は、視覚的なシーンを解析するタスクだけに費やされています。

右側の図は、脳の V1 領域と V2 領域がエッジとテクスチャに関する情報をどのように使用して、左側のテディベアのようなオブジェクトを表現するかを示しています。

こちらをクリックしてください高解像度画像の場合。

クレジット：Salk Institute

私たちの視覚認識は、明るいピクセルと暗いピクセルから始まります。これらの信号は脳の後部の V1 と呼ばれる領域に送信され、そこで視覚シーンのエッジに対応するように変換されます。どういうわけか、この情報がその後いくつか変換された結果、私たちは顔、車、その他の物体、およびそれらが動いているかどうかを認識できるようになります。この認識がどの程度正確に行われるのかは依然として謎であり、その理由の一部は、物体をコード化するニューロンが複雑な方法で反応するためです。

今回、Sharpee と、Sharpee のグループの博士研究員である Ryan Rowekamp は、これらの複雑な応答を取得し、解釈可能な方法で記述する統計的手法を開発しました。これは、コンピューターでシミュレートされた視覚の解読に役立つ可能性があります。モデルを開発するために、研究チームは計算神経科学共同研究 (CRCNS) データベースから自然の風景 (森林の風景など) の映画を見ている霊長類の脳反応を示す公開データを使用しました。

「私たちは、映画のどの特徴が V2 ニューロンの反応の変化を引き起こしているのかを解明するために、新しい統計手法を適用しました」と Rowekamp 氏は言います。「興味深いことに、V2 ニューロンがエッジの組み合わせに反応していることがわかりました。」

左から: タチアナ・シャープー、ライアン・ロウカンプ

こちらをクリックしてください高解像度画像の場合。

クレジット：Salk Institute

研究チームは、V2 ニューロンが 90 つの原則に従って視覚情報を処理していることを明らかにしました。まず、同様の向きを持つエッジを結合し、オブジェクトの境界を形成する曲線の位置の小さな変化に対する知覚のロバスト性を高めます。第二に、ニューロンが特定の方向と位置のエッジによって活性化される場合、そこから XNUMX 度の方向が同じ位置で抑制されます。この組み合わせは「交差方向抑制」と呼ばれます。これらの交差方向のエッジの組み合わせは、さまざまな視覚的形状を検出できるようにさまざまな方法で組み立てられます。研究チームは、正確な形状検出には交差方向が不可欠であることを発見しました。 XNUMX 番目の原則は、印象派の絵画のように、木や水のテクスチャーのある表面とそれらの間の境界を認識するのに役立つ方法で、関連するパターンが空間内で繰り返されるということです。

研究者らは、XNUMX つの組織化原則を Quadratic Convolutional モデルと名付けたモデルに組み込みました。このモデルは、他の一連の実験データにも適用できます。研究者らによると、視覚処理は脳が匂い、触覚、音を処理する方法と似ている可能性が高く、この研究によりこれらの領域のデータ処理も解明される可能性があるという。

「これまでに私が取り組んでいたモデルは、データと完全に互換性がないか、完全に互換性がありませんでした」と Rowekamp 氏は言います。「そのため、エッジ認識とテクスチャに対する感度を組み合わせるというアイデアが、複雑な視覚データを分析して理解するツールとして成果を上げ始めたときは、本当に満足でした。」

しかし、より直接的な応用は、自動運転車やその他のロボットデバイスの物体認識アルゴリズムを改善することかもしれません。「脳内にある計算要素をコンピュータビジョンアルゴリズムに追加するたびに、そのパフォーマンスが向上しているようです」とシャーピー氏は言います。

この作業は、によって資金提供されました。 National Science Foundation と国立眼病研究所。

目で見たものを脳がどのように認識するか

ソークニュース

目で見たものを脳がどのように認識するか

出版情報

研究分野

計算生物学

神経科学

詳細については

ソーク生物学研究所: