“la prochaine grande nouveauté en matière d’IA”

Table des matières

Google est toujours sur le sentier de la guerre contre OpenAI et a laissé hier la moitié du monde stupéfait avec le déploiement de sa nouvelle plateforme appelée Veo, chargée de générer des vidéos tout simplement majestueuses avec l’intelligence artificielle. DeepMind, l’organisation de recherche sur l’IA de Google, a dévoilé un modèle qui peut générer une variété infinie de mondes 3D jouables.

Les jeux vidéo ont presque toujours utilisé des moteurs de jeu chargés de créer ces mondes 3D basés sur des règles fixes pour la création « manuelle » des environnements dans lesquels le joueur se déplace, vole ou conduit. Certains jeux ont préféré une technique appelée génération procédurale (génération procédurale), qui crée des environnements aléatoires « corrects » au fur et à mesure que le joueur explore ; Minecraft est le meilleur exemple d’utilisation de cette technique dans ses mondes.

Ce qui permet assistez à un monde généré aléatoirement et correctement de sorte que l’exploration est l’un de ses principes de base. Ce n’est pas le seul jeu et d’autres ont déjà basé leur expérience sur ce type de génération aléatoire, comme le légendaire Diablo 2, dans lequel chaque fois qu’un jeu était lancé à partir de zéro, la carte était à nouveau générée pour que le joueur que je devais explorer encore une fois.

En gardant cela à l’esprit, c’est plus facile de comprendre la dimension qu’offre Genie 2le modèle successeur de DeepMind’s Genie, sorti plus tôt cette année, peut générer une scène interactive en temps réel à partir d’une seule image et d’une description textuelle. Sous cet aspect, il est similaire à d’autres modèles en cours de développement tels que Fei-Fei Li de World Labs et Decart.

Esprit profond de votre site internet prétend que Genie 2 peut générer une grande diversité de mondes 3D dans lequel les utilisateurs peuvent effectuer des actions telles que sauter et nager en utilisant la souris ou le clavier pour se déplacer dans cet environnement généré par l’IA. Ce modèle aurait été entraîné sur des vidéos et est capable de simuler des interactions avec des objets, des animations, des éclairages, la physique des objets, des reflets et même le comportement des PNJ (Non Player Controlled).

Générer des mondes interactifs jouables avec l’IA Genie 2 de DeepMind

Manuel Ramírez

Cette énorme capacité à générer des mondes qui ressemblent à des jeux vidéo AAAcomme Elden Ring ou Grand Theft Auto 5, est dû au fait que les données d’entraînement du modèle contiennent des jeux de titres populaires, bien que DeepMind, dans ce sens, n’ait pas voulu révéler de détails sur la source de données.

Il y a un autre aspect à prendre en compte et c’est que Genie 2 peut générer des mondes cohérents avec des perspectives différentes sous forme de vues à la première personne ou isométriques d’une durée maximale d’une minute. En fait, la grande majorité de ces mondes durent 10 à 20 secondes.

Et un autre point, Génie 2 répond intelligemment aux actions entreprises par l’utilisateur En appuyant sur les touches du clavier pour identifier le personnage et le déplacer correctement. Le pas franchi ici par DeepMind est incroyable, puisque même leur modèle peut identifier que les touches fléchées doivent déplacer le robot et non l’environnement ou d’autres PNJ.

Rappelez-vous les niveaux créés

Selon TechCrunch le grand aspect différenciateur pour mieux comprendre les réalisations de DeepMind—contrairement à d’autres simulateurs comme Oasis de Decart pour Minecraft qui génère en basse résolution et oublie rapidement les niveaux créés— Genie 2 peut mémoriser des parties de la scène simulée qui ne sont pas visibles par le joueur et ainsi les recréer pour les rendre visibles.

Génie 2

Génie 2

Google

L’Android gratuit

La limitation actuelle de Genie 2 efface les progrès chaque minute, c’est pourquoi DeepMind positionne actuellement le modèle comme un outil de création et de recherche. Une limitation qui pourrait s’évaporer à tout moment, puisque Google a investi d’énormes quantités de ressources dans ce qu’il considère comme « la prochaine grande avancée de l’IA ».

Déjà en octobre DeepMind a embauché Tim Brooksqui était le principal développeur de Sora d’OpenAI, l’incroyable outil permettant de générer des vidéos à partir d’un rapide et cela a laissé la moitié du monde stupéfait quand cela a été révélé. Brooks travaillerait sur les technologies de génération vidéo et les simulateurs de monde, rejoignant Tim Rocktäschel, connu pour ses expériences en monde ouvert dans des jeux tels que NetHack de Meta.

Leave a Reply