AlphaTensor, el modelo de DeepMind que descubre nuevos algoritmos

Imagen generada con Stable Diffusion.

Los algoritmos vertebran nuestra sociedad moderna. Pero su aplicación trasciende mucho más allá de la informática y un paseo por su extensa historia nos recuerda lo difícil y relevante que es encontrar nuevos para seguir haciéndonos la vida más fácil.

Bajo esta premisa, la empresa de inteligencia artificial DeepMind, conocida por su proyecto de IA polivalente Gato o el poderoso AlphaFold, ha presentado AlphaTensor. Lo definen como «el primer sistema de inteligencia artificial para descubrir algoritmos novedosos, eficientes y comprobablemente correctos para tareas fundamentales como la multiplicación de matrices».  Este modelo ha logrado que sus algoritmos superen a los que han sido diseñados por humanos. Todo un hito en el campo del descubrimiento algorítmico.

DeepMind se plantea con AlphaTensor arrojar luz a uno de los eternos retos matemáticos: hallar la forma más rápida posible de multiplicar matrices. Tal y como recuerda la empresa, esta operación se utiliza para procesar imágenes en smartphones, reconocer comandos de voz, generar gráficos para videojuegos, ejecutar simulaciones para predecir el clima, comprimir datos y vídeos para compartir en internet y un largo etcétera. «Empresas de todo el mundo dedican grandes cantidades de tiempo y dinero a desarrollar hardware informático para multiplicar matrices de manera eficiente. Por lo tanto, incluso las mejoras menores en la eficiencia de la multiplicación de matrices pueden tener un impacto generalizado», asegura DeepMind.

Jugar es la clave de AlphaTensor

Para afrontar esta misión, AlphaTensor se toma el reto como un juego para un solo jugador. Precisamente, el modelo se basa en otro muy popular de DeepMind: AlphaZero, el sistema de IA con un rendimiento superlativo en juegos de mesa que asombró a Garry Kasparov. Y este nuevo trabajo «muestra el viaje de AlphaZero desde los juegos hasta abordar problemas matemáticos sin resolver por primera vez».

En este juego, explica DeepMind, «el tablero es un tensor tridimensional (matriz de números) que captura qué tan lejos de corregir está el algoritmo actual». Después se trata de modificar este tensor: «A través de un conjunto de movimientos permitidos, correspondientes a las instrucciones del algoritmo, el jugador (la IA) intenta modificar el tensor y poner a cero sus entradas. Cuando logra hacerlo, esto da como resultado un algoritmo de multiplicación de matrices demostrablemente correcto para cualquier par de matrices, y su eficiencia se captura por el número de pasos tomados para poner a cero el tensor».

alphatensor-juego-explicacion
Foto: DeepMind

La dificultad de este juego es desorbitada por la inmensa cantidad de algoritmos que se pueden plantear. Mayor, incluso, que la cantidad de átomos en el universo. En este sentido, uno de los juegos más desafiantes tradicionalmente para la IA ha sido el de Go. Pues, en este caso, la cantidad de movimientos posibles en cada paso es 30 órdenes de magnitud mayor.

Para que AlphaTensor se desenvuelva bien en este juego, DeepMind apunta como clave la capacidad de «identificar la más pequeña de las agujas en un gigantesco pajar de posibilidades». Para ello, el modelo emplea una arquitectura de red neuronal que «incorpora sesgos inductivos específicos del problema, un procedimiento para generar datos sintéticos útiles y una receta para aprovechar las simetrías del problema».

Con esta arquitectura, DeepMind procedió a entrenar a la IA. Y lo hizo mediante el aprendizaje por refuerzo (a base de prueba y error). Como un soldado que va a la guerra sin armas, el sistema empieza el juego sin ningún conocimiento sobre los algoritmos de multiplicación de matrices existentes. Es en este punto donde AlphaTensor comienza a aprender de manera vertiginosa. Primero, redescubre algoritmos históricos de multiplicación de matrices rápidas como el de Strassen. Luego comienza a desarrollar otros que «superan la intuición humana». Así, el modelo termina «descubriendo algoritmos más rápidos de lo que se conocía anteriormente».

Además de hacer más eficientes los cálculos de muchas tareas computacionales, los algoritmos que descubra AlphaTensor tienen aún más potencial. DeepMind desvela que «podría impulsar nuevas aplicaciones para diseñar algoritmos que optimicen métricas como el uso de energía y la estabilidad numérica». Esto ayudaría a evitar que pequeños errores de redondeo se acumulen «como una bola de nieve» mientras funciona un algoritmo.

 

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *