A cartoon generated by ChatGPT using DALL-E with mangled text.
Agence web » Actualités du digital » La génération d'image de Chatgpt n'a toujours pas corrigé ma tâche planifiée préférée

La génération d'image de Chatgpt n'a toujours pas corrigé ma tâche planifiée préférée

Résumé

  • Les capacités de génération d'images de Chatgpt créent des caricatures involontairement hilarantes avec du texte mutilé.

  • Le nouveau modèle GPT-4O est bien meilleur pour générer des images avec du texte clair mais n'est pas utilisé pour les tâches planifiées.

  • Le manque de mises à jour des tâches programmées signifie que le rêve de caricatures parfaits est toujours en attente.

Les gens deviennent fous pour les nouvelles capacités de génération d'images de Chatgpt, créant tout à partir d'images d'eux-mêmes dans le style du studio Ghibli aux images d'autres personnes dans le style du studio Ghibli. Incroyablement, Chatgpt peut même créer des images dans d'autres styles.

Mis à part le sarcasme, j'étais très excité lorsque les nouvelles fonctionnalités ont été annoncées, car je pensais que cela signifierait une mise à niveau de qualité pour ma tâche planifiée préférée. Malheureusement, j'avais tort.

Chatgpt fait un dessin animé tous les matins (et ils sont hilarants mauvais)

Lorsque Chatgpt a annoncé pour la première fois qu'il ajoutait une fonctionnalité qui vous permet de créer des tâches planifiées, j'ai immédiatement défini quelques-uns. Certains étaient pratiques, comme une tâche planifiée qui m'envoie chaque matin une liste de tâches à long terme que je dois accomplir, ce que je peux lui demander de supprimer une fois que je les ai terminés.

Cependant, ma tâche programmée préférée était quelque chose de plus idiot. J'ai découvert que vous pouviez configurer une tâche planifiée pour générer une image à l'aide de Dall-E en fonction de votre description. Après quelques essais, j'ai réussi à mettre en place une tâche qui m'envoie un dessin animé original chaque matin.

Ces caricatures ont été une source d'intervalle d'hilarité, bien que la majeure partie ne soit pas intentionnelle. Bien qu'il y ait l'idée occasionnelle légèrement amusante, la plupart des rires viennent du fait que les idées sont généralement tout simplement bizarres.

Ce qui les rend encore plus drôles, c'est le texte.

La génération d'images de Dall-E que Chatgpt utilisait pour générer les images est très bien pour créer des images mais a vraiment du mal avec du texte. Il y a presque toujours des lettres superflues ou une écriture mutilée qui rendent les caricatures encore plus involontairement drôles.

Je pensais que mes jours de texte mutilés étaient terminés

Chatgpt a maintenant introduit un nouveau modèle de génération d'images qui remplace Dall-E, et c'est bien supérieur. Non seulement il peut générer des images photoréalistes impressionnantes avec une excellente adhésion à l'instruction, mais elle est également capable de reproduire votre texte exact (presque) tout le temps.

J'avais hâte de voir à quoi ressembleraient mes caricatures avec de meilleures images et du texte que vous pouvez lire. Cependant, lorsque mon premier est passé, c'était comme toutes les versions précédentes avec du texte mutilé et une qualité d'image ordinaire.

Ce n'était pas ce que j'attendais. Les images que je créais manuellement dans Chatgpt étaient excellentes, alors pourquoi mes dessins animés ne sortaient-ils pas aussi?

Les tâches programmées utilisent toujours Dall-E

J'ai essayé de demander directement à Chatgpt de générer un dessin animé dans le même style que mes versions précédentes, et après quelques ajustements pour m'assurer qu'il ne violait pas les politiques de contenu, j'ai eu un dessin animé avec une meilleure imagerie et un texte parfait, sans lettre mutilée en vue. Que se passait-il?

Il s'avère que, pour une raison quelconque, les tâches planifiées de Chatgpt reposent toujours sur Dall-E pour créer des images. Ceci malgré le fait que les tâches ChatGPT utilisent le modèle GPT-4O, et la génération d'images dans un chat GPT-4O standard utilisera désormais toujours le modèle de génération d'images 4O supérieur.

Les images générées par Dall-e ont même du texte sous elles qui se lit « Fabriqué avec l'ancienne version de la génération d'images. De nouvelles images à venir ». Les nouvelles images sont déjà là, cependant, tant que vous ne créez pas de tâche planifiée.

Je ne sais pas pourquoi c'est le cas. Si les tâches planifiées utilisent GPT-4O et que GPT-4O utilise la génération d'images 4O, vous penseriez que les tâches planifiées utiliseraient automatiquement la génération d'images 4O. Actuellement, cependant, ce n'est pas le cas.

Il y a une autre tâche planifiée que je veux créer

Les caricatures n'étaient pas la seule tâche planifiée pour laquelle je voulais générer des images. L'une des premières tâches programmées que j'ai essayées a été d'obtenir un chatppt pour rechercher les prévisions météorologiques d'aujourd'hui, puis utiliser ces informations pour générer une image qui a résumé les conditions météorologiques de la journée. De cette façon, j'aurais un résumé visuel rapide du temps de la journée chaque matin.

Cependant, j'ai constaté que les images incluaient presque toujours du texte, malgré mes meilleurs efforts pour l'empêcher de se produire. Comme vous pouvez probablement le deviner, ce texte a toujours fini par mutiler, ce qui rend l'image principalement inutile. J'ai dû abandonner l'idée à l'époque, mais j'espérais que je pourrais le faire fonctionner maintenant que la nouvelle génération d'images est là. Malheureusement, mon rêve de belles images de prévisions météorologiques est toujours en attente.

Mes caricatures parfaites devront attendre un peu plus longtemps

OpenAI a publié la prise en charge des tâches planifiées en janvier, mais au moment de la rédaction du modèle, le modèle est toujours étiqueté comme « GPT-4O avec des tâches planifiées (bêta) » dans l'application. Rien d'évidence n'a changé depuis la sortie de la fonctionnalité, et cela semble un peu comme si cela a été oublié, avec des sorties telles que O3-Mini, GPT-4.5 et 4O d'images qui arrivent toutes cette année.

Espérons que dans les prochains mois, les tâches programmées quitteront la version bêta et gagneront d'autres fonctionnalités. Il semblerait assez trivial de mettre à jour le modèle de génération d'image qui est utilisé, donc je garde mes doigts croisés qu'un jour je pourrai générer mon dessin animé quotidien avec du texte lisible. Jusque-là, je profiterai de mes caricatures maudits et j'attendrai patiemment le jour où je pourrai enfin lire les punchlines.

★★★★★