La innovación en inteligencia artificial (IA) sigue avanzando. Ahora DeepMind, la división de investigación de IA de Google, presenta Genie 2. Se trata de un modelo capaz de generar mundos 3D interactivos, es decir, entornos tridimensionales jugables a partir de descripciones de texto o imágenes, ampliando las posibilidades creativas para desarrolladores, investigadores y artistas.
De acuerdo con Google, Genie 2 no es un motor de juego; en cambio, es un modelo de difusión que genera imágenes a medida que el jugador se mueve por el mundo que el software está simulando.
En este sentido, a medida que genera fotogramas, Genie 2 puede inferir ideas sobre el entorno, lo que le da la capacidad de modelar efectos de agua, humo y física, aunque algunas de esas interacciones pueden ser muy divertidas.
TE PUEDE INTERESAR: ¡ChatGPT bajo lupa! Estudio señala problemas serios en la citación de fuentes
Qué es Genie 2 y cómo funciona
- Este nuevo sistema puede generar escenas en tiempo real que incluyen elementos como interacciones físicas, iluminación dinámica, animaciones y el comportamiento de NPCs (personajes no jugables).
- Entre sus características se encuentra la capacidad de simular acciones específicas, como saltar o nadar, que se activan con comandos del teclado o el ratón. Por ejemplo, al presionar las teclas de flechas, Genie 2 identifica que el movimiento debe aplicarse al personaje principal, no a objetos como árboles o nubes.
- Los mundos generados tienen una calidad visual comparable a los videojuegos AAA, posiblemente porque el modelo se entrenó con videos de títulos populares.
- Genie 2 puede generar entornos jugables desde diferentes puntos de vista, como perspectivas en primera persona o isométricas. Sin embargo, sus creaciones tienen un límite temporal: la mayoría de los escenarios generados duran entre 10 y 20 segundos, aunque algunos pueden extenderse hasta un minuto.
Foto: Google.