Imagen 4 de Google montre que la génération d'images AI atteint la maturité
Vous n'avez peut-être pas beaucoup entendu parler de l'IAM de Google Generative Generative, avec la plupart des nouvelles autour de cette technologie au fil des ans tournant autour de MidJourney, Dall-E et maintenant GPT-4O.
Cependant, Google s'est brandi à sa technologie sans relâche et lors d'une récente vitrine, Imagen a séduit le public. Cependant, avec la sortie de Imagen 4, il semble que les grands sauts du progrès soient terminés pour le moment, et maintenant il s'agit de raffiner ce dont cette technologie puissante est capable.
Sommaire
Imagen 4 n'est pas une révolution
Si vous regardez la vidéo Google I / O 2025 à partir de la marque 1:19:00, vous verrez les principales notes pour Imagen 4, la dernière et la plus grande technologie de génération d'images de Google.
Il ne semble pas être d'apporter des capacités entièrement nouvelles ou des sauts massifs en qualité. Au lieu de cela, l'imagen 4 concerne l'augmentation de la richesse d'image, les détails à grain fin et la résolution plus élevée. Bien que le présentateur l'appelle un « grand bond en avant », c'est clairement une amélioration de ce que Imagen 3 pourrait déjà faire, plutôt qu'un nouveau modèle révolutionnaire.
En rapport
La nouvelle génération d'images de Chatgpt ressemble à nouveau à Dial-up
Regarder mes images apparaître lentement de haut en bas me ramène au bon vieux temps.
La précision et la prévisibilité sont plus importantes maintenant
En plus d'améliorer les performances et les fonctionnalités de base de l'imagen, le thème central ici concerne principalement le contrôle et l'adhésion améliorés. Imagen 4 restera beaucoup plus étroitement à votre invite, et ne fera pas d'erreurs avec des éléments comme du texte, ou des couleurs pour les yeux spécifiques, etc.
Ceci est important, car même s'il est cool que vous puissiez créer de belles images en jetant des invites dans des outils comme MidJourney, si vous souhaitez utiliser la génération d'images AI comme un outil sérieux, il doit avoir des résultats prévisibles et contrôlables. Sur la base de mon propre jeu avec la version légère et rapide d'Imagen 4 qui est livrée avec mon abonnement Google AI, il semble que les plus grandes progrès sont en effet la précision et le contrôle.
Je pense que nous pouvons considérer en grande partie la question du texte brouillé dans les images d'IA résolues, à la fois ici avec Imagen 4 et avec d'autres systèmes de génération d'images majeurs. Non seulement il est résolu, mais le modèle aura même une disposition cohérente et fera des choix de polices appropriés. Il suffit de regarder cette affiche d'anniversaire que j'ai demandé.
Les images ci-dessus sont étiquetées comme Imagen 4 images par Gemini, mais Imagen 4 images ne sont pas censées avoir le filigrane visible. Cela fait toujours partie de l'aperçu gratuit pour les abonnés Google AI, et les résultats sont conformes à ce que Imagen 4 promet avec son modèle léger et rapide, mais je pensais que cela valait la peine d'être mentionné.
En rapport
Chatgpt peut enfin générer des images avec du texte lisible
Le nouveau générateur d'images GPT-4O est une énorme étape de Dall-E 3.
Ceci est la phase finale de la génération d'images d'intermédiaire intérimaire
Dans l'ensemble, pour moi, il semble que tout le travail majeur se fait en ce qui concerne la génération d'images AI. C'est arrivé si rapidement, et dans de si grands sauts, que cela fasse l'esprit. Cependant, tout ce qui reste maintenant est le polonais, le poli et le plus polonais.
En rapport
J'annule le milieu du milieu pour GPT-4O
Out avec l'ancien et avec le nouveau.
Avec la possibilité de faire des modifications détaillées des images existantes que vous avez générées et un contrôle précis de ce qui apparaît dans l'image, où il apparaît, et à quoi il devrait ressembler, je pense que nous sommes presque là pour la génération d'images pour quitter la phase expérimentale en tant que fonctionnalité bêta dans des applications comme Photoshop.
L'étape suivante est l'efficacité
Un domaine qui aura toujours besoin d'amélioration est le coût et la vitesse. Vous avez peut-être lu à quel point l'IA génératrice utilise beaucoup d'électricité et est en fait assez cher. Cela a des préoccupations environnementales et, bien sûr, que la puissance de calcul aurait pu être utilisée pour quelque chose de moins trivial. Cependant, le coût de la génération d'images baisse et la vitesse augmente.
Cela se produit pour plusieurs raisons, dont la plus évidente est que les modèles eux-mêmes deviennent plus petits et plus efficaces. En outre, le matériel d'IA spécialisé est désormais plus courant dans les centres de données, et ces puces peuvent faire les mathématiques nécessaires plus rapidement et avec moins de puissance. Enfin, tout le calcul devient encore moins cher, tant que les micropuces s'améliorent.
En rapport
Créer de l'art avec MidJourney: Conseils et techniques pour les débutants
Comment provoquer une image plus jolie.
Dans le cas d'imagen, Google affirme que l'imagen 4 images coûtent quatre cents à générer, ce qui est 25% de plus qu'Imagen 3, mais comme le nouveau modèle est tellement plus rapide et offre plus de qualité, il est en fait moins cher lorsque vous tenez compte de cela.
En allant de l'avant, je vois que la plupart des efforts sont maintenant mis à rendre la génération d'images bon marché, à la fois en termes d'argent et en termes de pouvoir. Ce que vous voulez vraiment, c'est avoir ce niveau de qualité et de vitesse en utilisant des modèles locaux et en cours d'exécution sur le matériel que vous avez avec vous, pas quelque part dans le cloud.
En rapport
Une fermeture de robot tragique montre pourquoi l'IA locale est si importante
Le corps ne peut pas vivre sans l'âme.
