Google Gemini peut générer à nouveau des images de personnes
Pendant longtemps, le moteur de génération d'images Imagen de Google a eu un gros problème par rapport à des concurrents tels que Dall-E – il ne pouvait pas générer correctement des images de personnes. Maintenant, Google ouvre enfin l'option à tous les utilisateurs.
La version gratuite de son chatbot Gemini gagne désormais la possibilité de créer des images de personnes. Cette décision suit le déploiement initial de la génération d'images pour payer les abonnés avancés de Gemini de manière «un accès précoce». Maintenant, lorsque vous demandez au chatbot de générer des images contenant des gens, cela n'échappera plus à votre question et générera en fait des images avec des personnes.
J'ai joué un peu avec un peu et j'ai découvert qu'il avait encore des limites. D'une part, il est bon pour générer des images de personnes aléatoires. Lorsque vous lui demandez de générer une image représentant quelqu'un d'identifiable, comme une célébrité, il tentera de le générer, mais il s'arrêtera finalement avant qu'il ne soit fait, vous disant qu'il ne peut pas encore générer d'images de personnes « identifiables ». Il y a une limite encore plus difficile aux politiciens et aux personnalités controversées où les Gémeaux n'essaieront même pas de générer une image en premier lieu, mais cela est également en place avec la plupart des questions liées à la politique actuelle. Si votre invite est quelque chose comme « Faire une image d'un couple de parachutisme », Gemini le fera – ne demandez pas de noms spécifiques.
Pendant des mois, la possibilité de générer des images représentant des personnes était un différenciateur clé pour le service avancé Premium Gemini de Google. Il a été lancé en août 2024 dans le cadre du déploiement d'imagen 3, et parmi les nombreuses améliorations qu'Imagen 3 avait, l'une d'entre elles était la capacité améliorée du modèle à gérer les requêtes contenant des représentations de personnes. Cette fonctionnalité a ensuite été étendue au panneau latéral Gemini dans des applications populaires d'espace de travail Google comme Gmail, Docs et les diapositives, bien que vous deviez toujours payer le niveau AI premium. Maintenant, c'est aussi lentement mais régulièrement aux utilisateurs gratuits – ils avaient toujours une génération d'images, mais pas avec les gens, donc c'est maintenant moins limité.
Pour rappel, Gemini avait précédemment fermé la possibilité de générer des images de personnes parce qu'elle avait des problèmes fondamentaux que Google avait besoin pour polir avant son déploiement. Les problèmes comprenaient des paramètres de diversité trop sensibles qui randomiseraient essentiellement la race des personnes que vous génériez – ce qui est devenu un problème lorsqu'il a commencé à créer des images comme un Black George Washington. Cela pourrait rapidement devenir problématique, donc Google a choisi d'ajouter un filtre dur aux Gémeaux qui empêcheraient les utilisateurs de générer des images avec des gens dedans jusqu'à ce qu'ils soient triés. Il était initialement censé être juste pour quelques semaines, mais il a fini par prendre des mois et la sortie d'un modèle de génération toute nouvelle avant que nous revoyions cela. Google a probablement sous-estimé la quantité de travail et de recyclage qu'il faudrait pour résoudre ce problème.
Le modèle a probablement besoin de travail, comme en témoignent le fait qu'il refuse toujours certaines invites, en particulier celles impliquant des personnes identifiables. Mais bon, c'est mieux que rien du tout. Et les images elles-mêmes sont également assez nettes et réalistes la plupart du temps.
À l'heure actuelle, le nouveau modèle n'est pas disponible partout pour les utilisateurs gratuits, car Google fait probablement un déploiement à l'échelle de la fonctionnalité pour s'assurer absolument que rien ne va mal avec lui. Si vous souhaitez l'utiliser maintenant et sauter la ligne, vous devrez toujours payer pour Gemini Advanced, ce qui vous donnerait accès à plus de choses, telles que des modèles expérimentaux, que vous trouverez utile si vous êtes un Gémeaux fréquents utilisateur.