Quelle est la qualité de Midjourney chez AI Art?  Nous avons comparé tous les modèles
Agence web » Actualités du digital » Quelle est la qualité de Midjourney chez AI Art? Nous avons comparé tous les modèles

Quelle est la qualité de Midjourney chez AI Art? Nous avons comparé tous les modèles

MidJourney est sans doute l’outil de génération d’art IA le plus facile à utiliser et à obtenir des résultats étonnants, mais il est facile d’oublier que ce n’était pas si impressionnant au lancement. Voyons jusqu’où il en est !

Notre Méthodologie

MidJourney fonctionne en acceptant des « invites » textuelles décrivant le type d’image que vous souhaitez générer via l’application Discord. Si vous voulez apprendre à utiliser le logiciel, il existe de nombreux guides MidJourney géniaux sur le Web qui vous permettront d’être opérationnel en un rien de temps. Pour cet article, nous nous concentrons sur la comparaison de l’amélioration de la technologie de MidJourney au cours des 15 mois environ entre la V1 et la V5.1, qui est la plus récente à ce jour.

MidJourney vous permet de basculer manuellement entre l’une de ses versions de modèle à l’aide /settings qui vous donnera ces options.

Panneau d'options de mi-journée dans Discord

Ici, nous pouvons choisir entre les différentes versions de MidJourney. Incidemment, les options « Niji » sont des modèles formés spécifiquement pour générer des images dans le style japonais Anime et Manga, donc si c’est votre truc, essayez-les.

Toutes les images générées pour cet article utiliseront le paramètre Haute qualité, avec le niveau de style par défaut, qui détermine le comportement strict ou lâche du modèle lorsqu’il suit l’invite.

Nous utiliserons les cinq mêmes invites avec chaque modèle afin que vous puissiez faire une comparaison directe. Nous n’utiliserons aucun paramètre spécial MidJourney et nous nous en tiendrons aux invites en texte brut en anglais simple.

Nous avons utilisé ChatGPT-4 pour proposer cinq invites pour tester MidJourney, représentant une variété de défis. Voici les invites que nous utilisons :

  • Peinture à l’huile d’un paysage surréaliste
  • Photo d’une rue animée du centre-ville dans les années 1920
  • Art conceptuel d’un paysage urbain futuriste la nuit
  • Peinture d’un tigre blanc dans la neige
  • Portrait d’une femme surprise

MidJourney fournit quatre images en réponse à chaque invite. Nous choisirons celui qui (à notre avis) est le meilleur des quatre à présenter ici à titre de comparaison. Voyons donc à quel point cela s’est amélioré depuis le peu de temps qu’il existe.

Midjourney V1 (février 2022)

Nous sommes fermement dans le domaine du carburant cauchemardesque onirique avec la V1 de MidJourney. En un coup d’œil, ces images vous donnent le impression de ce qu’ils sont, mais dès que vous les regardez, tout s’effondre. Les visages humains sont particulièrement dérangeants.

MidJourney V2 (12 avril 2022)

La V2 ne semble pas être un énorme bond en avant par rapport à la V1, mais il y a une nette amélioration de la composition, particulièrement visible dans la scène de rue des années 1920. Le tigre blanc a définitivement un meilleur contour qu’avant, et le visage de la femme est un peu moins effrayant.

Remarquez comment, dans certaines images, il y a une sorte de pseudo-signature sur la pièce. C’est parce que l’IA a appris que les images de certains styles ont des signatures, et elle a donc essayé de reproduire quelque chose qui y ressemble.

MidJourney V3 (25 juillet 2022)

Avec la V3, nous constatons définitivement une amélioration significative de la cohérence et de la composition. Les détails sont clairement éteints sans trop d’examen, mais la quantité de bruit aléatoire est définitivement réduite et les images ont plus de sens pour l’œil humain.

MidJourney V4 (5 novembre 2022)

Nous parlons maintenant! La V4 montre une amélioration spectaculaire de la composition, des détails et du dynamisme et de l’imagination des images. Un peu plus de six mois depuis la V1, et ces images sont définitivement dans le domaine de la convivialité, souvent telles qu’elles sont sans autre modification. Il faut beaucoup plus d’examen pour repérer les failles révélatrices de l’IA.

MidJourney V5 (15 mars 2023)

Les améliorations avec la V5 sont un peu plus subtiles qu’auparavant, mais elles sont substantielles. Outre l’amélioration technique des détails et de la composition, ces pièces semblent plus « imaginatives », avec encore plus de dynamique, des choix de couleurs plus larges, et une présentation globalement beaucoup plus agréable. Bien que la V4 ait certainement déplacé les images résultantes dans la zone grise entre la meilleure compétence technique humaine et ce que la génération d’IA peut faire, la V5 rend pratiquement impossible de dire que ces images sont créées par l’IA lorsque MidJourney tire sur tous les cylindres.

La V5 est également remarquable pour résoudre l’un des plus gros problèmes de la génération d’images IA : les mains !

Les sorciers de MJ V5 se serrent la main

L’image ci-dessus de la V5 montre que le problème a été résolu dans l’ensemble, bien qu’ici vous puissiez toujours voir que l’une des mains peut soit avoir un petit doigt manquant, soit simplement obscurcie. Des boîtiers Edge comme ceux-ci se glissent encore, mais il semble que l’époque des personnes avec des mains à 7 doigts soit presque révolue.

MidJourney V5.1 (3 mai 2023)

Alors que la dernière mise à jour du modèle que nous examinons ici n’est peut-être qu’une mise à jour « .1 », il n’y a certainement pas d’erreur sur l’amélioration. S’appuyant sur les principes fondamentaux de la V5, la V5.1 peaufine les défauts mineurs de la V5 tout en montrant, à nos yeux, une amélioration indubitable de l’expression et du flair artistique général.

Il est difficile d’imaginer où MidJourney peut aller à partir d’ici, mais la quantité de progrès jusqu’à présent est tout simplement époustouflante, et nous avons hâte de voir ce qui est possible ensuite.

★★★★★