19 de septiembre de 2018
Nuevo estudio aplica aprendizaje por refuerzo para fijar un rumbo hacia la inteligencia artificial
Nuevo estudio aplica aprendizaje por refuerzo para fijar un rumbo hacia la inteligencia artificial
LA JOLLA—Las palabras “volar como un águila” son famosamente parte de una canción, pero también pueden ser palabras que hagan rascarse la cabeza a algunos científicos. Especialmente cuando se trata de aves de rapiña como águilas, halcones y gavilanes, que parecen ascender a grandes alturas sobre colinas, cañones y cimas de montañas con facilidad. Los científicos se dan cuenta de que las corrientes ascendentes de aire cálido ayudan a las aves en su vuelo, pero no saben cómo las aves encuentran y navegan estas plumas térmicas.
Para descubrirlo, investigadores del Instituto Salk y de la Universidad de California en San Diego utilizaron aprendizaje por refuerzo para entrenar planeadores a navegar de forma autónoma en térmicas atmosféricas, elevándose a alturas de 700 metros, casi 2.300 pies. Los novedosos resultados de la investigación, publicados el 19 de septiembre en la edición de Naturaleza, resalta el papel de las aceleraciones verticales del viento y los torques por alabeo como señales biológicas viables para las aves que planean. Los hallazgos también proporcionan una estrategia de navegación que se aplica directamente al desarrollo de vehículos autónomos de planeo, o vehículos aéreos no tripulados (VANT).
“Este artículo es un paso importante hacia la inteligencia artificial: cómo volar autónomamente en térmicas en constante cambio como un pájaro. Me sorprendió que se necesitara relativamente poco aprendizaje para alcanzar un rendimiento experto”, dice el Profesor Terrence Sejnowski, jefe del Laboratorio de Neurobiología Computacional de Salk y uno de los autores del artículo.

El aprendizaje por refuerzo es un área del aprendizaje automático, inspirada en la psicología conductista, mediante la cual un agente aprende a comportarse en un entorno basándose en las acciones realizadas y sus resultados. Según Massimo Vergassola, profesor del Departamento de Física de la UC San Diego, y Gautam Reddy, candidato a doctorado, ofrece un marco adecuado para identificar una estrategia de navegación eficaz como una secuencia de decisiones tomadas en respuesta a señales ambientales.
“Establecemos la validez de nuestra política de vuelo aprendida mediante experimentos de campo, simulaciones numéricas y estimaciones del ruido en las mediciones que inevitablemente está presente debido a la turbulencia atmosférica —explicó Vergassola—. Esta es una instancia novedosa de aprendizaje de una tarea de navegación en el campo, donde el aprendizaje se ve seriamente desafiado por una multitud de efectos físicos y la impredecibilidad del entorno natural”.“
En el estudio, realizado en colaboración por el Instituto Salk, la División de Ciencias Biológicas de la UC San Diego y el Centro Internacional Abdus Salam de Física Teórica en Trieste, Italia, el equipo equipó planeadores con una envergadura de dos metros con un controlador de vuelo. El dispositivo permitió la implementación a bordo de políticas de vuelo autónomo a través de un control preciso del ángulo de alabeo y cabeceo. Una estrategia de navegación se determinó únicamente a partir de las experiencias combinadas de los planeadores recopiladas durante varios días en el campo utilizando estrategias de comportamiento exploratorio. Las estrategias se basaron en nuevos métodos a bordo, desarrollados en el curso de la investigación, para estimar con precisión las aceleraciones verticales del viento locales de los planeadores y los torques de rodadura, que sirvieron como señales de navegación.
La metodología de los científicos incluyó la estimación de la aceleración vertical del viento, los gradientes verticales de la velocidad del viento en las alas de los planeadores, el diseño del módulo de aprendizaje, el aprendizaje de la estrategia de termalización en el campo, la prueba del rendimiento de la política aprendida en el campo, la prueba del rendimiento para diferentes envergaduras en simulaciones y la estimación del ruido en la detección de gradientes debido a la turbulencia atmosférica.
Sejnowski añade: “Estos resultados son significativos porque pudimos aplicar con éxito nuestro trabajo de simulación anterior a un planeador del mundo real”.”
El trabajo fue financiado por la beca 340106 de la Simons Foundation.
Este comunicado se basa en materiales proporcionados por la Universidad de California San Diego.
DIARIO
Naturaleza
AUTORES
Gautam Reddy, Jerome Wong Ng, Antonio Celani, Terrence J. Sejnowski y Massimo Vergassola
Oficina de Comunicaciones
Tel.: (858) 453-4100
press@salk.edu
El Instituto Salk es un centro de investigación independiente y sin fines de lucro fundado en 1960 por Jonas Salk, creador de la primera vacuna segura y eficaz contra la poliomielitis. La misión del Instituto es impulsar una investigación fundamental, colaborativa y audaz que aborde los retos más acuciantes de la sociedad, entre ellos el cáncer, la enfermedad de Alzheimer y la vulnerabilidad agrícola. Esta ciencia fundamental sustenta todos los esfuerzos traslacionales, generando conocimientos que permiten el desarrollo de nuevos medicamentos e innovaciones en todo el mundo.