Fijemos una posición clara desde el principio. Lo que hoy llamamos inteligencia artificial está más relacionado con la «fuerza bruta» que con un proceso mental elegante o sofisticado. Por ejemplo, mientras que a un bebé le cuesta media docena de intentos aprender algo, a las máquinas ese mismo aprendizaje les supone millones de pruebas. Pero para nosotros, usuarios de esta tecnología, toda esa frenética actividad de ensayo y error es invisible. Solo vemos el resultado.
Esto se convierte en un problema cuando intentamos enseñar a las máquinas a desenvolverse en el mundo físico que nos rodea, ya que no contamos con suficientes ejemplos que ilustren cómo interactuamos y nos movemos, a menudo de forma caótica, en nuestro entorno. Hemos digitalizado toda la información disponible, ahora contenida en zettabytes de datos en Internet, pero el mundo material, junto a las leyes físicas que lo rigen, se ha quedado fuera.
Además, tampoco es fácil describir con palabras tareas tan sencillas como atarse los cordones o formular esa ecuación que nos permite atrapar con la mano una pelota en movimiento. Nosotros lo hacemos de forma automática, sin pensar. Esto contrasta con las dificultades de las máquinas para moverse con soltura y llevar a cabo tareas cotidianas como colgar ropa en un perchero, pasar las páginas de un libro o preparar un plato de comida.
Sin embargo, algo está cambiando. Este verano, Jensen Huang, director ejecutivo de Nvidia, proclamó el comienzo de una nueva era marcada por la llegada de la IA al mundo físico. Esta apuesta cristalizó ayer en el entorno de la mayor feria de electrónica de consumo del mundo, el CES de Las Vegas, con el anuncio de Cosmos, la plataforma de IA del gigante del hardware para modelizar y simular el mundo físico. Si esto es cierto, significará que, a partir de ahora, veremos cada vez más máquinas capaces de percibir, comprender y actuar de manera autónoma a nuestro alrededor.
Pero ¿por qué ahora? La respuesta está en un conjunto de cambios que, actuando de forma combinada y retroalimentándose los unos a los otros, lo hace posible.
En primer lugar, destaca la mayor capacidad de cómputo. Algo que está en la base de todos los cambios tecnológicos que estamos experimentando. Las computadoras son cada vez más rápidas y potentes gracias a los avances en los chips especializados en IA. Por ejemplo, las nuevas GPU de Nvidia (Blackwell) prometen reducir el consumo de energía aumentando el rendimiento 30 veces más que la generación precedente. La velocidad de la innovación es tan rápida que, a veces, antes de que los chips se empiecen a comercializar, ya existe una nueva generación que los supera.
A esto se añade la digitalización acelerada del mundo físico. Con la llegada del metaverso y los gemelos digitales, ahora podemos crear versiones virtuales del mundo real, como en los videojuegos en 3D. Estas réplicas digitales nos permiten realizar infinidad de pruebas a bajo coste y aprender de ellas sin tener que enfrentar el tedio e, incluso, en algunos casos, el riesgo de llevarlas a cabo en el mundo físico.
Por último, se han producido avances en las técnicas de aprendizaje que las hacen más efectivas. Antes, las máquinas necesitaban miles o millones de ejemplos para aprender a hacer algo. Ahora, los modelos de difusión son capaces de aprender de manera más rápida y eficiente. Estos funcionan tomando una imagen nítida y alterando poco a poco sus píxeles hasta que se vuelve irreconocible, para luego reconstruirla. Esta técnica, que antes solo se usaba con imágenes, ahora también se utiliza para describir movimientos de objetos, ayudando a las máquinas a entender cómo se mueven las cosas. El principio utilizado es el mismo, solo que, en lugar de alterar píxeles, se trabaja con trayectorias.
En síntesis, las computadoras son más potentes, pueden hacer simulaciones a bajo coste y aprender más rápido con menos ejemplos. Por eso, los robots están empezando a moverse con soltura a nuestro alrededor, utilizando con destreza todo tipo de herramientas. Esta versatilidad y autonomía está abriendo la puerta a un mundo lleno de posibilidades.
Pronto, veremos máquinas equipadas con “cerebros artificiales” realizando múltiples tareas en fábricas, en el campo e incluso en nuestros hogares. Un ejemplo es Figure, una empresa valorada en 2.600 millones de dólares, que recientemente ha recibido una financiación de 675 millones de destacados inversores como Microsoft, OpenAI y Nvidia. Lo primero que llama la atención al visitar la página web de la empresa es un vídeo de humanoides realizando tareas dentro de una fábrica de BMW (su primer acuerdo comercial). Se ve cómo los robots se mueven con fluidez ejecutando tareas de forma completamente autónoma. Con un peso de 70 kg y la capacidad de cargar hasta 20 kg, avanzan a 1,2 metros por segundo. Es verdad que su movimiento no es elegante, pero es preciso y eficiente.
La escena deja claro que en adelante las líneas de producción ya no estarán exclusivamente en manos de operarios. Es fácil imaginar un futuro en el que estos humanoides trabajen codo con codo con los humanos como compañeros. Además, gracias a la IA generativa, también podrán seguir instrucciones para adaptarse a necesidades cambiantes.
Otro ejemplo, esta vez fuera de las fábricas, es Anybotics. Esta joven empresa suiza tiene claro que sus robots vienen a sustituir a las personas en actividades peligrosas que no deberían estar realizando. En su página web se pueden ver máquinas haciendo inspecciones en minas o en cementerios de residuos nucleares. En este caso, el robot no convive con personas y su diseño recuerda a un perro y no a un ser humano. Resulta sorprendente ver como son capaces de moverse por superficies hasta hace poco impensables. Por ejemplo, caminando por un suelo rocoso.
Esto es posible porque no han sido preprogramados para caminar. En lugar de seguir instrucciones rígidas, toman decisiones de manera autónoma cuando se encuentran con obstáculos imprevistos. En otras palabras, son capaces de combinar “visión por computadora” e “inteligencia espacial” para interpretar su entorno de forma más flexible, similar a como lo haría un ser humano en una situación desconocida.
Existen más ejemplos de empresas que están aprovechando este salto de la IA al mundo físico. Por ahora, no parece que vayamos a ver un jugador dominante con un modelo maestro capaz de adaptarse a distintos casos de uso. Es decir, los robots que operan en las fábricas serán diferentes a los que cosechen los campos, inspeccionen residuos o entren en nuestras cocinas. Esto da una oportunidad a las startups capaces de encontrar su nicho. Es indiscutible que el potencial de mercado es formidable, una oportunidad de billones de euros que ningún gigante tecnológico querrá dejar escapar. De momento, la partida no ha hecho más que empezar. Algunos jugadores, como Jensen Huang, lo tienen claro cuando declara que “la próxima ola de la IA es una que comprende las leyes de la física y puede trabajar entre nosotros”.