A menudo se piensa en la inteligencia artificial como incorpórea: una mente como un programa, flotando en un vacío digital. Pero las mentes humanas están profundamente entrelazadas con nuestros cuerpos y un experimento con criaturas virtuales que realizan tareas en entornos simulados sugiere que la IA puede beneficiarse de tener una configuración mente-cuerpo.
Los científicos de Stanford tenían curiosidad acerca de la interacción físico-mental en nuestra propia evolución de manchas a simios que usan herramientas. ¿Será que el cerebro está influenciado por las capacidades del cuerpo y viceversa? Se ha sugerido antes hace más de un siglo, de hecho y ciertamente es obvio que con una mano prensil se aprende más rápidamente a manipular objetos que con un apéndice menos diferenciado.
Es difícil saber si se puede decir lo mismo de una IA, ya que su desarrollo está más estructurado. Sin embargo, las preguntas que plantea este concepto son convincentes: ¿Podría una IA aprender y adaptarse mejor al mundo si ha evolucionado para hacerlo desde el principio?
El experimento que diseñaron es similar en algunos aspectos a entornos simulados que se han utilizado durante décadas para probar algoritmos evolutivos. Configura un espacio virtual y coloca criaturas simuladas simples en él, solo unas pocas formas geométricas conectadas que se mueven de manera aleatoria. De mil formas que se retuercen, eliges las 10 que se retorcieron más lejos y haces mil variaciones sobre ellas, y repites una y otra vez. Muy pronto tienes un puñado de polígonos haciendo un paseo bastante aceptable por la superficie virtual.
Sin embargo, todo eso es viejo: como explican los investigadores, necesitaban hacer que su simulación fuera más robusta y variable. No estaban simplemente tratando de crear criaturas virtuales que caminaran, sino de investigar cómo esas criaturas aprendieron a hacer lo que hacen, y si algunas aprenden mejor o más rápido que otras.
Para averiguarlo, el equipo creó una simulación similar a las anteriores, colocando sus sims, a los que llamaron “unimales” (para “animales universales” – veremos si esta terminología despega), al principio solo para aprender andar. Las formas simples tenían una “cabeza” esférica y unas pocas extremidades articuladas en forma de ramas, con las que desarrollaban una serie de paseos interesantes. Algunos tropezaban hacia adelante, algunos desarrollaron un andar articulado como el de un lagarto y otros un estilo agitado pero efectivo que recordaba a un pulpo en tierra.
¡Míralos irse!. Créditos de imagen: Stanford
Hasta ahora, tan similar a los experimentos anteriores, pero ahí terminan más o menos las similitudes.
Algunos de estos animales crecieron en diferentes planetas de origen, por así decirlo, con colinas ondulantes o barreras bajas para trepar. Y en la siguiente fase, los animales de estos diferentes terrenos compitieron en tareas más complejas para ver si, como suele decirse, la adversidad es la madre de la adaptabilidad.
“Casi todo el trabajo previo en este campo ha desarrollado agentes en un terreno plano simple. Además, no hay aprendizaje en el sentido de que el controlador y/o el comportamiento del agente no se aprende a través de interacciones sensoriomotoras directas con el entorno”, explicó el coautor Agrim Gupta a TechCrunch, en otras palabras, evolucionaron sobreviviendo pero no Realmente se aprende haciendo. “Este trabajo por primera vez hace evolución y aprendizaje simultáneos en entornos complejos como terrenos con escalones, colinas, crestas y se mueve más allá para realizar la manipulación en estos entornos complejos”.
Los 10 mejores animales de cada entorno se lanzaron a tareas que iban desde nuevos obstáculos hasta mover una pelota a una portería, subir una caja por una colina o patrullar entre dos puntos. Aquí fue donde estos “gladiadores” realmente demostraron su temple virtual. Los animales que habían aprendido a caminar en terrenos variables aprendieron sus nuevas tareas más rápido y las realizaron mejor que sus primos de las llanuras.
Créditos de imagen: Stanford
“En esencia, encontramos que la evolución selecciona rápidamente morfologías que aprenden más rápido, lo que permite que los comportamientos aprendidos tarde en la vida de los primeros ancestros se expresen temprano en la vida de sus descendientes”, escriben los autores en el artículo, publicado hoy en la revista. Naturaleza.
No es solo que aprendieron a aprender más rápido; el proceso evolutivo seleccionó tipos de cuerpo que les permitirían adaptarse más rápido y aplicar lecciones más rápido. En terreno llano, un salto de pulpo podría llevarte a la línea de meta igual de rápido, pero las colinas y las crestas se seleccionaron para una configuración de carrocería rápida, estable y adaptable. Llevar este cuerpo a la arena de gladiadores les dio a esos animales provenientes de la escuela de golpes duros una ventaja en la competencia. Sus cuerpos versátiles pudieron aplicar mejor las lecciones que sus mentes estaban poniendo a prueba y pronto dejaron atrás a su competencia más flácida.
¿Qué significa todo esto, además de proporcionar algunos GIF entretenidos de figuras de palos en 3D galopando sobre un terreno virtual? Como dice el documento, el experimento “abre la puerta a la realización de experimentos in silico a gran escala para generar conocimientos científicos sobre cómo el aprendizaje y la evolución crean relaciones sofisticadas entre la complejidad ambiental, la inteligencia morfológica y la capacidad de aprendizaje de las tareas de control”.
Digamos que tiene una tarea relativamente complicada que le gustaría automatizar subir escaleras con un robot de cuatro patas, por ejemplo. Puede diseñar los movimientos manualmente o combinar movimientos personalizados con los generados por IA, pero quizás la mejor solución sería hacer que un agente evolucione su propio movimiento desde cero. El experimento muestra que existe un beneficio potencial real al hacer que el cuerpo y la mente que lo controlen evolucionen en tándem.
Si es un experto en programación, puede poner en marcha toda la operación en su propio hardware: el grupo de investigación ha hecho que todo el código y los datos estén disponibles gratuitamente en GitHub. Y asegúrese de tener su clúster de computación de alta gama o contenedor en la nube listo para funcionar también: “Los parámetros predeterminados suponen que está ejecutando el código en 16 máquinas. Asegúrese de que cada máquina tenga un mínimo de 72 CPU”.
Inteligentes IA que buscan y esconden aprenden a usar herramientas y romper las reglas