La nouvelle génération d'images de Chatgpt ressemble à nouveau à Dial-up
Sommaire
Résumé
-
La génération d'images 4o est une mise à niveau importante de Chatgpt.
-
Les images apparaissent lentement en haut, tout comme les images téléchargées sur les connexions de numérotation.
-
Attendre des images est un changement bienvenu par rapport à la gratification instantanée de la technologie la plus moderne.
En mars de cette année, OpenAI a publié une fonctionnalité intitulée 4O Image Generation. Il s'agit d'une mise à jour des capacités de génération d'images de Chatgpt qui apportent un certain nombre d'améliorations, telles que un texte plus précis, une meilleure adhésion à l'instruction et un photoréalisme amélioré.
Le processus n'est cependant pas instantané. La façon dont vous pouvez regarder les images apparaître en temps réel me ramène dans le bon vieux temps de dial-up.
Chatgpt Images et la révélation lente
De nombreuses images d'IA sont générées en commençant par un bruit aléatoire, comme la statique que vous voyez dans l'intro des spectacles HBO. Le modèle AI affine ensuite ce bruit en fonction de l'invite, chaque itération devenant moins comme un bruit aléatoire et plus comme l'image prévue. Finalement, après suffisamment d'itérations, l'image devrait ressembler à l'invite.
Cela signifie que la génération d'une image prend du temps. Avec certains modèles d'IA, vous pouvez regarder le processus se produire, en voyant l'image passer de la statique floue à une image finie. Chaque étape montre l'état de l'image complète avant la prochaine itération.
La génération d'images 4o est cependant un peu différente. Il montrera d'abord une représentation très floue de ce à quoi ressemblerait l'image finale, mais l'image clarifie progressivement. Plutôt que cela arrive à toute l'image à la fois, cependant, cela se produit de haut en bas.
Le haut de l'image est fini en premier, tandis que le reste reste un flou. La frontière entre l'image terminée et floue déplade lentement l'image afin que vous ne voyiez pas l'image terminée jusqu'à ce qu'elle atteigne le fond.
Un flash-back sur les jours de numérotation
La première fois que j'ai vu cela se produire, j'ai été immédiatement renvoyé à 30 ans aux jours d'Internet Dial-Up. À l'époque, les vitesses les plus rapides que vous puissiez obtenir étaient de 56 kbps, et la réalité était généralement beaucoup plus lente. Ces vitesses étaient si lentes que le téléchargement d'une image de 100 kb pourrait facilement prendre 30 secondes ou plus.
En rapport
7 choses nostgaliques à propos de dialogue Internet Nous ne manquons pas vraiment
Composez « M » pour les « souvenirs ».
La façon dont les images téléchargées sur Dial-up sont très similaires à la façon dont les nouvelles images de Chatgpt apparaissent. Chaque rangée de pixels se chargerait en haut, ce qui signifie que vous verriez d'abord le haut de l'image et que vous devriez attendre que le reste de l'image se charge avant de le voir.
Pourquoi le ralentissement?
Il n'est pas tout à fait clair pourquoi la nouvelle fonctionnalité de génération d'images de Chatgpt utilise cette nouvelle méthode descendante. Dall-E, le modèle de génération d'image précédente d'OpenAI, ne s'est pas comporté de la même manière.
Les images générées à l'aide de la génération d'images 4O sont certainement bien supérieures à celles générées à l'aide de DALL-E, et la production de meilleures images est susceptible de prendre plus de temps. Selon un tweet du PDG d'Openai, Sam Altman, il semble que de nombreux utilisateurs de Chatgpt utilisent la fonctionnalité assez fortement, au point où l'entreprise envisage de limiter son utilisation temporairement. Si les GPU d'OpenAI « fondent », la génération d'images est susceptible de prendre plus de temps qu'elle ne le pourrait autrement.
Cela expliquerait pourquoi les images se chargent lentement mais pas la façon dont les images sont affinées de haut en bas. Que ce soit une conséquence de la façon dont les images sont générées ou parce que quelqu'un d'Openai manque vraiment les jours de numérotation n'est pas clair.
Il y a quelque chose à dire pour avoir à attendre
Nous vivons dans un monde de gratification instantanée. Vous avez accès à la somme totale de toutes les connaissances humaines dans votre poche arrière, et nous la tenons principalement pour acquises. Nous n'avons plus vraiment à attendre les choses, sauf lorsque des entreprises comme Apple détruisent cruellement des épisodes de Seèche à un rythme d'un par semaine.
En rapport
Devriez-vous attendre une saison entière ou regarder des émissions chaque semaine?
À la frénésie ou à ne pas se balancer?
Je déteste le fait que si je dois attendre 30 secondes pour un ascenseur ou pour que les publicités se terminent, ma main atteindra automatiquement mon téléphone, pour remplir ces secondes avec un défilement insensé. Je dois aller à l'extrême pour m'empêcher de faire un décollage à chaque occasion disponible.
En rapport
10 façons d'arrêter les concours sur votre iPhone
Obtenez de l'aide pour échapper au cycle afin que vous puissiez aller toucher de l'herbe.
Mais il y a quelque chose à dire pour avoir à attendre quelque chose de bien. Le chargement lent des images dans les jours de numérotation était frustrant, surtout si les informations dont vous aviez besoin (ou le bit de l'image que vous vouliez le plus voir) était en bas et était la dernière chose à charger.
Il y avait quelque chose de tout à fait magique à regarder l'image apparaître sous vos yeux, cependant, et je ne savais pas à quel point j'ai manqué cela jusqu'à ce que Chatgpt me le rappelle.
La génération lente peut ne pas être là depuis longtemps
Bien que j'apprécie vraiment l'expérience de regarder mes images apparaître lentement sous mes yeux, je ne pourrai peut-être pas en profiter longtemps. Le rythme des développements de l'IA ne montre aucun signe de ralentissement. Il n'y a pas longtemps, les images de l'IA étaient hilarantes faciles à détecter simplement en regardant les mains mutilées, mais les images générées par l'AI-AI sont très difficiles à repérer.
À mesure que cette technologie s'améliore, il est probable que la génération d'images devienne encore plus rapide et la révélation lente disparaîtra pour toujours. J'ai l'intention de l'apprécier pendant que je peux, car vous ne savez pas ce que vous avez jusqu'à ce qu'il soit parti.