A shiny robot paints a picture while a rusty old robot looks on.
Agence web » Actualités du digital » J'annule le milieu du milieu pour GPT-4O

J'annule le milieu du milieu pour GPT-4O

Résumé

  • GPT-4O crée des images réalistes époustouflantes plus efficacement que Midjourney.

  • L'IA multimodale de Chatgpt peut régénérer intelligemment les vieilles images Midjourney, améliorant la génération d'images.

  • Les outils intégrés du chatbot et de la génération d'images de ChatGPT révolutionnent le processus de création d'image collaboratif.

Je suis un fan fidèle de Midjourney depuis quelques années maintenant, surtout après que le modèle V4 ait perdu et tout a époustouflé. Au moins à mon avis! Maintenant, cependant, je change les équipes du dernier modèle de Chatgpt, qui remplace Dall-E.

Je ne pense pas avoir vu juste un saut dramatique de capacité et de qualité en une seule fois, et plus j'utilise la nouvelle fonctionnalité de génération d'images de GPT-4O, moins j'ai ressenti le besoin d'utiliser MidJourney. Maintenant, cet abonnement est annulé.

GPT-4O crée des images époustouflantes

Prenons la première et la plus importante raison pour laquelle j'ai éteint – les images sont absolument incroyables. MidJourney a toujours excellé dans la création de belles images artistiques qui ressemblent à des peintures ou à l'art numérique. Cependant, j'ai toujours pensé qu'il tombe un peu court en ce qui concerne les images plus utilitaires. Le genre de chose que je dois créer quand aucun des sites d'image en stock que j'utilise n'a exactement la bonne image.

Maintenant, GPT-4O peut faire des images utilitaires réalistes qui semblent photo-réalistes sans trop de bruit. MidJourney a toujours une ambiance particulière qui empêche ce genre d'images de paraître réelle, mais GPT-4O a des résultats scandaleusement convaincants.

Il s'est trompé notre logo, mais selon le bot lui-même, c'est par conception pour éviter la violation des marques. Quoi qu'il en soit, ce n'est pas une vraie personne, et pas une vraie chemise, et honnêtement, je ne l'aurais pas su.

Ajoutez à cela, GPT-4O est maintenant également capable d'un flair artistique similaire à MidJourney (tel qu'il est), et il semble plus intelligent d'aller avec 4O.

Ce n'est pas seulement à cause des capacités de génération d'images pures, mais parce que mon abonnement à Chatgpt comprend tout ce pour quoi je utilise les chatbots IA. C'est donc une réduction nette des coûts d'abonnement. J'avais tenu MidJourney, car Chatgpt ne pouvait pas générer d'images que je considérais comme utilisables, mais ce n'est plus le cas.

En rapport

Créer de l'art avec MidJourney: Conseils et techniques pour les débutants

Comment provoquer une image plus jolie.

Je peux réellement réparer mes vieilles photos de MidJourney

L'une des meilleures choses à propos de la génération d'images avec Chatgpt est que le Chatgpt AI multimodal peut consulter les images que vous fournissez et les utilisez intelligemment avec son propre système de génération d'images.

Par exemple, ici, j'ai pris une photo en coulisses de Patrick Stewart en tant que capitaine Picard avec les cheveux, et j'ai demandé à Chatgpt de le changer en mulet.

Vous pouvez donc voir, bien que la nouvelle image soit complètement générée à partir de zéro, tous les mêmes éléments de base ont été reproduits. Cela signifie que je peux prendre des images MidJourney dont je ne peux pas bien faire, ou je ne suis pas satisfaite, et les alimenter en GPT-4O, en lui demandant de le réparer. Comme cette image qui est censée être néo La matrice, mais Midjourney a continué à se tromper.

Ce qui est vraiment cool, c'est que Chatgpt a d'abord analysé l'image pour identifier ce qu'il pense ne fonctionne pas, puis j'ai eu un va-et-vient rapide avec moi pour clouer ce avec quoi je suis d'accord et ce que je voulais.

L'itération d'image change la donne

C'est cette conversation itérative et va-et-vient qui me fait vraiment ouvrir le chatpt au lieu de Midjourney quand je veux faire quelque chose. MidJourney est juste un modèle de génération d'images, mais l'utilisation de Chatgpt ressemble plus à travailler avec un illustrateur ou un artiste, leur donnant des exemples de ce que je veux, leur demandant de faire des modifications aux images existantes et collaborant généralement pour créer les images dont j'ai besoin.

Je n'ai jamais eu l'impression d'être «l'artiste» lors de l'utilisation d'un logiciel de génération d'images, mais plus comme je n'étais toujours qu'un client commandant une image. Sauf dans ce cas, le service est fourni par l'intelligence artificielle. Le seul problème est que le logiciel est peu communicatif, et je dois espérer que mon invite le frotte dans la bonne façon.

Maintenant, avec le chatbot et les pouvoirs de génération d'images de GPT combinés, j'ai absolument l'impression d'engager une entité intelligente qui comprend ce que je demande, et je peux regarder sa propre sortie et voir qu'elle est gâchée si nécessaire.

La connaissance de GPT le distingue

GPT possède une énorme réserve de connaissances générales qui, enrichissons son auto-réparation pour la génération d'images, comprennent les images que vous fournissez et comprenez le contexte lorsque vous demandez quelque chose. J'aime particulièrement lorsque Chatgpt me questionne sur des détails que je n'ai pas pensé à demander, afin qu'il ait une idée plus complète de ce que je veux.

Cela a entraîné un taux de réussite beaucoup plus élevé, et je passe moins de temps à attendre que l'image génère et plus de temps à obtenir exactement ce que je voulais.

Je découvre toujours de nouvelles astuces

Parce que l'outil de génération d'images GPT-4O est plus que la somme de ses parties, je découvre constamment de nouvelles choses que je peux en faire. La capacité de constituer le concept de l'image en détail d'abord, en conversation avec le bot, signifie que je peux maintenant essayer des choses qui ne fonctionneraient tout simplement pas dans MidJourney. Surtout en ce qui concerne la mise en page, l'adhésion rapide et la génération de texte.

En rapport

GPT-4O peut-il colorer les vieilles photos? En quelque sorte, mais soyez prudent!

Color moi surpris.

Je fais toujours beaucoup des mêmes choses que je faisais avec MidJourney, mais c'est juste plus intuitif, plus réussi, et maintenant avec ce nouveau modèle avancé de génération d'images, je dirais que cela semble aussi bon, sinon mieux, que MidJourney dans la plupart des cas.


Cela dit, au moment où j'écris ceci, le modèle V7 de Midjourney est à l'étape alpha du développement, et je ne parierais pas contre la société qui sort les gros canons pour rivaliser avec GPT-4O. Alors qui sait, peut-être que je reviendrai si la nouvelle technologie m'impressionne suffisamment.

★★★★★