9 de novembro de 2017
A maneira como as moscas-das-frutas identificam semelhanças entre odores oferece uma nova abordagem para algoritmos de busca
LA JOLLA—Todos os dias, os sites que você visita e os aplicativos de smartphones que você usa estão processando enormes conjuntos de dados para encontrar coisas que se assemelham: produtos semelhantes às suas compras anteriores; músicas semelhantes às que você gostou; rostos semelhantes às pessoas que você identificou nas fotos. Todas essas tarefas são conhecidas como buscas por similaridade, e a capacidade de realizar esses jogos de correspondência massivos bem — e rápido — tem sido um desafio constante para os cientistas da computação.
Fale Connosco para uma imagem de alta resolução
Crédito: Salk Institute
Agora, Salk e os cientistas da UC San Diego descobriram que o cérebro da mosca da fruta tem um método elegante e eficiente de realizar pesquisas de similaridade. Para as moscas, ajuda a identificar os odores mais semelhantes aos que já encontraram, para que saibam como se comportar em resposta ao odor, como abordá-lo ou evitá-lo. Novos detalhes sobre a abordagem computacional da mosca para buscas de similaridades fedorentas, descritas na revista Ciência em 9 de novembro de 2017, poderia informar algoritmos de computador do futuro.
“Esse é um problema que praticamente todas as empresas de tecnologia com qualquer tipo de sistema de recuperação de informações precisam resolver, por isso é algo que os cientistas da computação estudam há anos”, diz Saket Navlakha, professor assistente no Laboratório de Biologia Integrativa de Salk e principal autor do novo artigo. “Agora, temos essa nova abordagem para pesquisas de similaridade graças ao fly”.
A maneira como a maioria dos sistemas de dados computadorizados categoriza itens - de músicas a imagens - para otimizar as pesquisas de similaridade é reduzindo a quantidade de informações associadas a cada item. Esses sistemas atribuem "hashes" curtos a cada item, de modo que é mais provável que itens semelhantes sejam atribuídos ao mesmo hash ou a um hash semelhante em comparação com dois itens muito diferentes. (Hashes são uma espécie de abreviatura digital, da mesma forma que um bitly é uma versão mais curta de uma URL.) A atribuição de hashes dessa maneira é chamada de “hashing sensível à localidade” para os cientistas da computação. Ao pesquisar itens semelhantes, um programa examina os hashes, em vez dos itens originais, para encontrar semelhanças rapidamente.
Navlakha estava conversando com um colega Carlos Stevens, professor do Laboratório de Neurobiologia Molecular de Salk e coautor do novo trabalho, que estudou o olfato de moscas, quando o primeiro percebeu que as moscas – e todos os animais – também são constantemente confrontados com buscas de similaridade. Então ele começou a vasculhar a literatura sobre os circuitos cerebrais por trás do olfato das moscas para descobrir como as moscas identificam cheiros semelhantes.
“No mundo natural, você não encontrará exatamente o mesmo odor todas as vezes; haverá algum ruído e flutuação”, explica Navlakha. “Mas se você sentir o cheiro de algo que já associou a um comportamento, precisa ser capaz de identificar essa semelhança e lembrar desse comportamento.” Então, se uma mosca da fruta sabe que o cheiro de uma banana podre significa hora da refeição, ela precisa responder da mesma forma quando encontra um cheiro muito semelhante, mesmo que nunca tenha sentido aquele cheiro antes.
Fale Connosco para uma imagem de alta resolução
Crédito: Salk Institute
A revisão da literatura feita por Navlakha e seus colaboradores revelou que, quando as moscas-das-frutas sentem um odor pela primeira vez, 50 neurônios disparam em uma combinação exclusiva desse cheiro. Mas, em vez de misturar essa informação reduzindo o número de hashes associados ao odor, como fariam os programas de computador, as moscas fazem o oposto – elas expandem a dimensão. Os 50 neurônios iniciais levam a 2,000 neurônios, espalhando a entrada para que cada cheiro tenha uma impressão digital ainda mais distinta entre esses 2,000 neurônios. O cérebro então armazena apenas 5% desses 2,000 neurônios com a atividade principal como o “hash” para aquele odor. Todo o paradigma ajuda o cérebro a perceber as semelhanças melhor do que em comparação com a redução da dimensão, diz Navlakha.
“Digamos que você tenha um monte de pessoas agrupadas por seus relacionamentos, e elas estão amontoadas em uma sala lotada”, explica ele. “Em seguida, pegue as mesmas pessoas e relacionamentos, mas espalhe-os em um campo de futebol. Será muito mais fácil ver a estrutura dos relacionamentos e traçar limites entre os grupos no espaço expandido em relação ao espaço lotado.”
Embora Navlakha e seus colaboradores não tenham revelado o mecanismo real pelo qual as moscas armazenam as informações de odor – que já estava disponível na literatura –, eles são os primeiros a analisar como esse processo maximiza a velocidade e a eficiência das buscas por similaridade. Quando eles aplicaram o processo a três conjuntos de dados padrão que os cientistas da computação usam para testar algoritmos de busca, eles descobriram que a abordagem fly melhorou o desempenho. Essa abordagem, eles pensam, pode informar os programas de computador algum dia.
“Pedaços dessa abordagem foram usados no passado por cientistas da computação, mas a evolução os uniu de uma maneira única”, diz Navlakha.
Os colaboradores de Navlakha dizem que o estudo está entre os primeiros a fazer paralelos concretos entre os circuitos neurais no cérebro e os algoritmos de processamento de informações usados na ciência da computação.
“Nos últimos 20 anos, tenho me interessado por projeções aleatórias [um componente central do hash sensível à localidade para pesquisa de similaridade] quando elas se aplicam a algoritmos executados em computadores”, diz Sanjoy Dasgupta, professor de ciência da computação e engenharia da UCSD e primeiro autor do novo artigo. “Nunca me ocorreu que operações semelhantes possam ocorrer na natureza.”
“Um sonho compartilhado por neurobiólogos e cientistas da computação é entender como o cérebro computa bem o suficiente para que possamos adaptar seus métodos para melhorar a computação da máquina”, acrescenta Stevens. “Nosso artigo fornece uma prova de princípio de que esse sonho pode se tornar realidade.”
O trabalho e os pesquisadores envolvidos foram apoiados por doações da National Science Foundation (EAGER PHY-1444273) e do Army Research Office (DOD W911NF-17-1-0045).
JORNAL
Ciência
IMERSÃO DE INGLÊS
Um algoritmo neural para um problema de computação fundamental
AUTORES
Sanjoy Dasgupta, Charles F. Stevens, Saket Navlakha
Escritório de Comunicações
Tel: (858) 453-4100
press@salk.edu
Desvendar os segredos da própria vida é a força motriz por trás do Salk Institute. Nossa equipe de cientistas premiados e de classe mundial amplia os limites do conhecimento em áreas como neurociência, pesquisa do câncer, envelhecimento, imunobiologia, biologia vegetal, biologia computacional e muito mais. Fundado por Jonas Salk, desenvolvedor da primeira vacina segura e eficaz contra a poliomielite, o Instituto é uma organização de pesquisa independente e sem fins lucrativos e um marco arquitetônico: pequeno por opção, íntimo por natureza e destemido diante de qualquer desafio.