3 de dezembro de 2018
Nova estrutura descoberta por cientistas do Salk pode melhorar os métodos de aprendizado de máquina ou ajudar a detectar quando a detecção de novidades está prejudicada no cérebro
LA JOLLA—Pode parecer que as moscas-das-frutas não têm nada em comum com os computadores, mas uma nova pesquisa do Salk Institute revela que os dois identificam novas informações de maneiras semelhantes. A obra, que apareceu em Procedimentos da Academia Nacional de Ciências (PNAS) em 3 de dezembro de 2018, não apenas lança luz sobre um importante problema neurobiológico - como os organismos detectam novos odores - mas também pode melhorar os algoritmos para detecção de novidades na ciência da computação.
“Quando uma mosca sente um odor, ela precisa descobrir rapidamente se já sentiu o cheiro antes, para determinar se o odor é novo e algo a que deve prestar atenção”, diz Saket Navlakha, professor assistente no Laboratório de Biologia Integrativa de Salk e co-autor correspondente do artigo. “Na ciência da computação, essa é uma tarefa importante chamada detecção de novidades. Compreender como as estratégias de detecção de novidades se comparam em ambos os domínios pode nos fornecer informações valiosas sobre algoritmos cerebrais e computação”. Os pesquisadores sugerem que sua nova estrutura pode ser útil na detecção de duplicatas ou anomalias em grandes conjuntos de dados de streaming, como bancos de dados de pacientes ou notícias.
Fale Connosco para uma imagem de alta resolução.
Crédito: Salk Institute
Em 2017, Navlakha descobriu como os cérebros voam identificar semelhante odores. Ele descobriu que a aplicação do algoritmo fly a “pesquisas de similaridade” de computador (como aquelas que sugerem produtos para comprar semelhantes às suas compras anteriores) melhorou os resultados da pesquisa.
O novo PNAS estudo é baseado em outro artigo [Hattori et al.] que saiu em 2017 na revista Célula, descrevendo como as moscas detectam odores inteiramente novos. Quando Navlakha leu o estudo, ficou impressionado com a forma como as moscas pareciam estar usando uma tática semelhante a uma ferramenta computacional para detecção de novidades chamada filtro Bloom.
Quando um mecanismo de busca como o Google rastreia a Web, ele precisa saber se um site que encontrou já foi indexado anteriormente, para que não perca tempo indexando o mesmo site novamente. O problema é que existem trilhões de sites na Web e armazenar todos eles na memória é computacionalmente caro. Na década de 1970, Howard Bloom, do MIT, desenvolveu uma estrutura de dados que pode armazenar um grande banco de dados de itens de forma compacta. Em vez de armazenar cada item no banco de dados em sua totalidade, um filtro Bloom armazena uma pequena “impressão digital” de cada item usando apenas alguns bits de espaço por item. Ao verificar se a mesma impressão digital aparece duas vezes no banco de dados, um sistema pode determinar rapidamente se o item é uma duplicata ou algo novo.
As moscas-das-frutas são bem conhecidas por mudarem seu comportamento em resposta a novos odores. Uma região no cérebro da mosca, chamada de corpo de cogumelo, contém uma coleção de neurônios que processam informações olfativas. Quando um novo odor é experimentado, esses neurônios transmitem um sinal de “alerta de novidade” para que a mosca saiba que esse odor é novo e vale a pena investigar. Se o odor, no entanto, não tiver um impacto forte, na próxima vez que o odor for sentido, a força do sinal de alerta é reduzida e a mosca não perde tempo investigando o odor. Este é um cálculo importante porque a mosca quer prestar atenção em algo apenas se valer a pena. O sinal de novidade do corpo de cogumelo da mosca é gerado usando uma impressão digital para odores semelhante à “impressão digital de dados” do filtro Bloom.
Fale Connosco para uma imagem de alta resolução
Crédito: Salk Institute
“Um desafio fundamental no aprendizado de máquina é encontrar representações de dados que sejam adequadas para uma ampla gama de tarefas”, diz Sanjoy Dasgupta, professor de ciência da computação e engenharia na UC San Diego e primeiro autor do novo artigo. “O sistema olfativo da mosca nos mostra uma maneira simples e engenhosa de fazer isso.”
Ao analisar - de uma perspectiva da ciência da computação - o circuito neural, identificado no artigo da Cell, que gera esse sinal inovador, Navlakha e Dasgupta descobriram que a mosca da fruta introduziu algumas novas reviravoltas no filtro Bloom tradicional, que sua equipe elaborou e definida matematicamente.
A primeira reviravolta envolve não apenas determinar se você sentiu exatamente o mesmo odor antes, mas também se sentiu o cheiro ou algo bastante semelhante a ele. Isso é importante no cérebro porque é provável que você nunca sinta exatamente o mesmo odor duas vezes. A segunda reviravolta envolve determinar há quanto tempo você sentiu o cheiro. Se já faz muito tempo, a novidade do odor deve ser maior do que se você o cheirou recentemente.
Com base na variante do filtro Bloom da mosca da fruta, a equipe criou uma nova estrutura algorítmica para prever as respostas inovadoras das moscas da fruta. Eles testaram sua estrutura em dados de pesquisa coletados quando as moscas foram apresentadas a pares de odores em sucessão. As previsões de novidade da equipe acabaram correspondendo de perto à resposta de novidade real dos neurônios do corpo de cogumelo, o que validou a precisão de sua estrutura. A equipe de Navlakha então testou a estrutura em vários conjuntos de dados de aprendizado de máquina e descobriu que o filtro Bloom da mosca melhorou a precisão da detecção de novidades em comparação com outros tipos de filtros de detecção de novidades.
Navlakha acrescenta: “O que torna este trabalho especialmente empolgante para nós é que ele representa uma das primeiras estruturas de dados descobertas no cérebro, junto com um algoritmo simples de como o cérebro pode realmente realizar a detecção de novidades”.
O trabalho foi financiado pelo Pew Charitable Trusts, o Kavli Institute for Brain and Mind e o NIDCD dos National Institutes of Health sob o prêmio número 1R01DC017695.
Outros autores incluíram Timothy C. Sheehan da UC San Diego e Charles F. Stevens de Salk.
JORNAL
Procedimentos da Academia Nacional de Ciências (PNAS)
IMERSÃO DE INGLÊS
AUTORES
Sanjoy Dasgupta, Timothy C. Sheehan, Charles F. Stevens e Saket Navlakha
Escritório de Comunicações
Tel: (858) 453-4100
press@salk.edu
Desvendar os segredos da própria vida é a força motriz por trás do Salk Institute. Nossa equipe de cientistas premiados e de classe mundial amplia os limites do conhecimento em áreas como neurociência, pesquisa do câncer, envelhecimento, imunobiologia, biologia vegetal, biologia computacional e muito mais. Fundado por Jonas Salk, desenvolvedor da primeira vacina segura e eficaz contra a poliomielite, o Instituto é uma organização de pesquisa independente e sem fins lucrativos e um marco arquitetônico: pequeno por opção, íntimo por natureza e destemido diante de qualquer desafio.