Un ordenador aprende a jugar a videojuegos gracias a una red neuronal artificial
- El agente ha aprendido a jugar a 49 videojuegos clásicos
- Superó las puntuaciones de sus predecesoras en 43 videojuegos
- A la máquina se le dan bien juegos de boxeo, carreras o 3D
Un algoritmo es capaz de aprender a superar juegos clásicos de la videoconsola Atari 2600, como Space Invaders o el comecocos, a partir de una información mínima. Creado por investigadores de la empresa de Google Deep Mind, el nuevo agente artificial logró más del 75% de la puntuación en más de la mitad de los juegos frente a un humano.
Demis Hassabis y su equipo de investigadores en Inteligencia Artificial se propusieron el reto de crear un algoritmo que permitiera a un ordenador aprender por sí mismo, sin apenas información previa, ha informado Sinc.
Hasta ahora, el método que habían empleado los ingenieros computacionales era el aprendizaje por refuerzo, basado en el estímulo y la recompensa pero que, según los investigadores, “es limitado en situaciones complejas y su aplicación se limita a los entornos controlables”.
Red neuronal artificial
La novedad que aportan los investigadores de Deep Mind es la combinación de este tipo de aprendizaje con una red neuronal artificial a imagen y semejanza de las biológicas. El resultado, publicado en la revista Nature, es un algortimo denominado deep Q-network (DQN), surgido a partir de un aprendizaje por refuerzo 'profundo'.
El estudio muestra que este agente artificial ha aprendido por sí mismo a jugar a 49 videojuegos clásicos de la videoconsola Atari 2600, entre los que se encuentran Pacman (el popular comecocos) o Space Invaders, partiendo de información sobre los píxeles y el número de acciones posibles en cada juego.
“Usamos los mismos datos iniciales para todos los juegos, lo que demuestra que el agente aprende con éxito los procedimientos de cada uno basándose únicamente en las entradas sensoriales”, explican los investigadores.
Capaz de vencer a seres humanos
La máquina superó las puntuaciones de sus predecesoras en 43 de los 49 videojuegos. Pero sus logros no se quedan ahí, según los autores: “Su rendimiento se puede comparar con el de un probador profesional humano de videojuegos”.
El método destacó en actividades de índole muy variada, desde los juegos de boxeo a los de carreras de coches en 3D, “lo que demuestra que utilizando la misma arquitectura, la máquina puede aprender a optimizar estrategias en diferentes ambientes”.
Para los investigadores, este algoritmo también puede ayudar a los científicos a entender el proceso de aprendizaje de las personas. Asimismo, esperan que ayude crear productos más útiles, como “mejorar el motor de búsqueda de Google para completar tareas complejas como, por ejemplo, planear un viaje”.