Copilot est hallucinant une version jouable de Quake II
Microsoft démontre son nouveau modèle Whamm avec une version générative en temps réel de Quake II. Vous pouvez jouer au jeu généré par l'AI dans votre navigateur, bien que ce ne soit vraiment qu'une preuve de concept – ce n'est pas très amusant.
Les jeux génératifs en temps réel détruiront ou augmenteront l'industrie du jeu, selon qui vous demandez. Dans tous les cas, le développement de modèles de jeux génératifs s'accélère à un rythme rapide. Les chercheurs ont compris comment courir Perte Dans le modèle d'apprentissage neuronal de Google de Google, Oasis Ai vous permet de jouer une version générative folle de Minecraft Dans le navigateur et en février 2025, Microsoft a présenté son système de jeu génératif WHAM unique.
Le modèle WHAM-1.6B que Microsoft a montré il y a six semaines était impressionnant mais peu pratique. Il a généré une seule image par seconde à une résolution de 300 x 180, et il a nécessité sept ans de données d'entraînement pour créer un jeu « jouable ». Microsoft a commencé à travailler sur le Whamn amélioré (World Human Action Maskgit Model) peu de temps après ses débuts WHAM-1.6b, et les résultats sont un peu choquants. Non seulement Whamn fonctionne avec une résolution vidéo de 600 x 340 (deux fois celle du WHAM-1.6b), mais elle émet des images à un minimum de 10 ips et a réussi à copier Quake II avec seulement une semaine de données de formation.
Une architecture raffinée est responsable de ces améliorations. Au lieu d'utiliser un système typique de type « LLM » autorégressif où le modèle AI génère un jeton à la fois, la configuration du maskgit de Whamm peut « générer tous les jetons pour une image dans autant de générations que nous le souhaitons ». En d'autres termes, le nouveau modèle utilise un traitement parallèle pour augmenter la vitesse de sortie, la qualité de l'image et la précision prédictive.
Les jeux générés par Whamm sont, d'un point de vue pratique, pas très amusant à jouer. Il a l'air flou, souple et croustillant, la fréquence d'images n'est pas idéale (bien que ce ne soit pas si différent de ce que les joueurs ont vécu en 1997), et les ennemis en jeu sont pratiquement méconnaissables. La démonstration est également atroce, bien que Microsoft blâme la « latence notable » sur son lecteur Web, plutôt que le modèle lui-même.
Whamm souffre également du problème de « mémoire à court terme » que nous voyons dans d'autres modèles de jeux génératifs. En tant que modèle prédictif, Whamm génère de nouvelles cadres en regardant les cadres précédents – il est mauvais pour garder une trace de la santé et des munitions, les ennemis peuvent disparaître si vous le détournez (ou apparaissez au hasard sans raison), et si vous poussez votre personnage contre un mur ou en regardant au sol, vous pouvez être téléporté à un endroit différent sur la carte.
Cependant, dans mes tests, Whamm semble avoir moins de problèmes de « mémoire à court terme » que certains autres modèles. Sa durée de contexte de 0,9 seconde est juste Assez bon pour empêcher la folie trippante et courbée que j'ai connue en jouant avec des minecrafts génératifs, bien que la longueur du contexte soit clairement un énorme défi que Microsoft devra surmonter.
Je dois également noter que Whamm n'a été formé que sur le premier niveau de Quake II. Si vous montez dans l'ascenseur à la fin du niveau, le modèle se fige. Ainsi, l'affirmation de Microsoft selon laquelle Whamn peut être formé sur une semaine de données vidéo est en quelque sorte trompeur – le modèle nécessite moins de données de formation que WHAM-1.6B, mais la quantité de données requises pour générer un jeu interactif variera en fonction de la longueur du contenu, de la complexité du jeu et d'autres facteurs.
En rapport
6 appareils qui ne peuvent pas fonctionner
Peut-être que Doom ne peut pas courir sur tout après tout.
Quant à la façon dont cette technologie sera utilisée à l'avenir – eh bien, Microsoft sait que l'IA générative en temps réel peut produire des «nouveaux types de médias interactifs», mais il explore toujours ce que ces médias devraient être.
Vous pouvez lire la version générée en temps réel de Quake II sur le site Web de Copilot Labs. Les jeux sont chronométrés et se réinitialiseront lorsque la minuterie s'épuisera. Encore une fois, ce jeu n'est qu'une preuve de concept, alors n'attendez pas trop.