Researchers train robotic gliders to soar - Salk Institute for Biological Studies

Noticias del Instituto Salk

19 de septiembre de 2018

Investigadores entrenan planeadores robóticos para planear

Nuevo estudio aplica aprendizaje por refuerzo para fijar un rumbo hacia la inteligencia artificial

19 de septiembre de 2018

LA JOLLA—Las palabras “volar como un águila” son famosamente parte de una canción, pero también pueden ser palabras que hagan rascarse la cabeza a algunos científicos. Especialmente cuando se trata de aves de rapiña como águilas, halcones y gavilanes, que parecen ascender a grandes alturas sobre colinas, cañones y cimas de montañas con facilidad. Los científicos se dan cuenta de que las corrientes ascendentes de aire cálido ayudan a las aves en su vuelo, pero no saben cómo las aves encuentran y navegan estas plumas térmicas.

Para descubrirlo, investigadores del Instituto Salk y de la Universidad de California en San Diego utilizaron aprendizaje por refuerzo para entrenar planeadores a navegar de forma autónoma en térmicas atmosféricas, elevándose a alturas de 700 metros, casi 2.300 pies. Los novedosos resultados de la investigación, publicados el 19 de septiembre en la edición de Naturaleza, resalta el papel de las aceleraciones verticales del viento y los torques por alabeo como señales biológicas viables para las aves que planean. Los hallazgos también proporcionan una estrategia de navegación que se aplica directamente al desarrollo de vehículos autónomos de planeo, o vehículos aéreos no tripulados (VANT).

“Este artículo es un paso importante hacia la inteligencia artificial: cómo volar autónomamente en térmicas en constante cambio como un pájaro. Me sorprendió que se necesitara relativamente poco aprendizaje para alcanzar un rendimiento experto”, dice el Profesor Terrence Sejnowski, jefe del Laboratorio de Neurobiología Computacional de Salk y uno de los autores del artículo.

Bird & Glider — Crédito: Phil Richardson, Woods Hole Oceanographic Institution

El aprendizaje por refuerzo es un área del aprendizaje automático, inspirada en la psicología conductista, mediante la cual un agente aprende a comportarse en un entorno basándose en las acciones realizadas y sus resultados. Según Massimo Vergassola, profesor del Departamento de Física de la UC San Diego, y Gautam Reddy, candidato a doctorado, ofrece un marco adecuado para identificar una estrategia de navegación eficaz como una secuencia de decisiones tomadas en respuesta a señales ambientales.

“Establecemos la validez de nuestra política de vuelo aprendida mediante experimentos de campo, simulaciones numéricas y estimaciones del ruido en las mediciones que inevitablemente está presente debido a la turbulencia atmosférica —explicó Vergassola—. Esta es una instancia novedosa de aprendizaje de una tarea de navegación en el campo, donde el aprendizaje se ve seriamente desafiado por una multitud de efectos físicos y la impredecibilidad del entorno natural”.“

En el estudio, realizado en colaboración por el Instituto Salk, la División de Ciencias Biológicas de la UC San Diego y el Centro Internacional Abdus Salam de Física Teórica en Trieste, Italia, el equipo equipó planeadores con una envergadura de dos metros con un controlador de vuelo. El dispositivo permitió la implementación a bordo de políticas de vuelo autónomo a través de un control preciso del ángulo de alabeo y cabeceo. Una estrategia de navegación se determinó únicamente a partir de las experiencias combinadas de los planeadores recopiladas durante varios días en el campo utilizando estrategias de comportamiento exploratorio. Las estrategias se basaron en nuevos métodos a bordo, desarrollados en el curso de la investigación, para estimar con precisión las aceleraciones verticales del viento locales de los planeadores y los torques de rodadura, que sirvieron como señales de navegación.

La metodología de los científicos incluyó la estimación de la aceleración vertical del viento, los gradientes verticales de la velocidad del viento en las alas de los planeadores, el diseño del módulo de aprendizaje, el aprendizaje de la estrategia de termalización en el campo, la prueba del rendimiento de la política aprendida en el campo, la prueba del rendimiento para diferentes envergaduras en simulaciones y la estimación del ruido en la detección de gradientes debido a la turbulencia atmosférica.

Sejnowski añade: “Estos resultados son significativos porque pudimos aplicar con éxito nuestro trabajo de simulación anterior a un planeador del mundo real”.”

El trabajo fue financiado por la beca 340106 de la Simons Foundation.

Este comunicado se basa en materiales proporcionados por la Universidad de California San Diego.

Investigadores entrenan planeadores robóticos para planear

Noticias del Instituto Salk

Investigadores entrenan planeadores robóticos para planear

INFORMACIÓN DE PUBLICACIÓN

Áreas de investigación

Biología computacional

Neurociencia

Para más información

El Instituto Salk de Estudios Biológicos: