Qu'est-ce que l'IA générative ?
Agence web » Actualités du digital » Qu’est-ce que l’IA générative ?

Qu’est-ce que l’IA générative ?

L’IA générative est une technologie d’intelligence artificielle qui pourrait potentiellement transformer la façon dont nous interagissons avec les machines. C’est un type d’IA qui peut créer de nouveaux contenus comme du texte, des images, de l’audio et de la vidéo en fonction de sa compréhension du monde et des entrées de l’utilisateur.

Au cours des derniers mois, les applications utilisant l’IA générative ont explosé sur le marché. L’application photo AI Lensa et le chatbot d’OpenAI, ChatGPT, ont fait sensation car ils créent du texte et des images de haute qualité à la demande. Maintenant, Microsoft et Google jouent au rattrapage. Mais qu’est-ce que l’IA générative et comment ça marche ?

Qu’est-ce que l’IA générative ?

Pour le dire aussi simplement que possible : l’IA générative est une IA (dite « intelligence artificielle ») qui crée un contenu unique basé sur une invite d’un utilisateur. Par exemple, l’invite que vous donnez à Lensa pour faire de ces superbes photos de profil AI une sélection de selfies. Dans le cas de ChatGPT, une invite pourrait être « écrivez un sonnet sur les bagels dans le style de HL Mencken ». Le texte et les images qui en résultent sont entièrement uniques et générés par l’IA. Et ce ne sont pas seulement du texte et des images que l’IA générative peut créer. D’autres produits d’intelligence artificielle peuvent créer des recréations vocales étranges, et il existe même des services en attente qui peuvent créer du contenu vidéo basé sur des invites textuelles.

ChatGPT écrit un sonnet sur les bagels.

L’IA générative combine deux puissantes technologies d’IA : l’apprentissage automatique et la capacité de créer de nouveaux contenus. Les programmeurs d’IA utilisent l’apprentissage automatique pour créer des modèles capables de reconnaître des modèles et des tendances dans les données existantes, tandis que la génération de contenu permet la création d’éléments uniques comme une composition ou une image. Lorsqu’une IA dispose d’un échantillon suffisamment grand pour en tirer (son ensemble d’apprentissage), elle peut recréer à peu près tout ce qu’elle peut reconnaître. Et parce que l’ensemble de données pour former des modèles d’IA comme ChatGPT est si volumineux, il peut mélanger et assortir des éléments provenant de plusieurs sources pour fournir quelque chose qui est à la fois unique et reconnaissable comme tout ce que l’invite a demandé.

Types d’IA générative et leur fonctionnement

Une main de robot tenant une pile de boîtes.

Les algorithmes d’IA générative se présentent sous de nombreuses formes, mais se répartissent en trois catégories générales : les réseaux antagonistes génératifs (GAN), les auto-encodeurs variationnels (VAE) et les modèles de transformateurs comme GPT-4. Chaque type d’algorithme d’IA générative a ses avantages et ses inconvénients.

Les GAN sont un type d’IA générative qui utilise deux réseaux de neurones d’apprentissage en profondeur pour générer de nouvelles données. Le premier réseau, appelé le générateur, est formé pour créer de nouvelles données qui ressemblent au contenu existant, tandis que le second réseau, appelé le discriminateur, est formé pour faire la distinction entre les données réelles et générées. Au fur et à mesure que les programmeurs entraînent leurs IA, le générateur apprend à produire des images de plus en plus réalistes qui trompent le discriminateur en lui faisant croire qu’elles sont réelles. Ce processus est connu sous le nom de « jeu minimax » puisque chaque réseau essaie de déjouer l’autre tout en minimisant ses propres erreurs.

Un inconvénient potentiel des GAN est qu’ils peuvent parfois produire des images irréalistes ou floues. Par exemple, un GAN formé pour générer des images de visages humains peut parfois créer des images avec une paire d’yeux supplémentaire ou une structure faciale déformée. Les mains humaines peuvent ressembler à un véritable cauchemar. Cependant, cette technologie n’en est encore qu’à ses débuts, et des problèmes comme celui-ci seront résolus en temps voulu.

Les VAE sont un autre type d’IA générative utilisée pour générer de nouvelles données uniques. Contrairement aux GAN, les VAE utilisent une représentation compressée de leurs données d’entrée pour générer quelque chose de nouveau qui ressemble à l’original. Les VAE sont le plus souvent utilisés pour faire des images et des vidéos, mais ils peuvent aussi générer du texte. Une limitation potentielle des VAE est que leurs données peuvent ne pas être aussi variées que celles générées par les GAN car les VAE apprennent une représentation plus contrainte des données d’entrée. De plus, les VAE souffrent parfois des problèmes d’image déformée que rencontrent les GAN.

Les modèles de transformateurs comme GPT-4 sont une itération relativement récente de l’IA générative qui a attiré beaucoup de regards en raison de leurs performances impressionnantes sur de nombreuses tâches de traitement du langage naturel. ChatGPT est l’exemple actuel d’étoile d’or d’un produit d’IA basé sur un transformateur. Ces modèles sont basés sur un type d’architecture de réseau neuronal appelé « transformateur ». Ils sont conçus pour traiter des séquences de données massives, sont formés sur un énorme ensemble de données textuelles et peuvent apporter des réponses cohérentes et contextuellement pertinentes à une invite.

L’avantage des modèles de transformateurs est qu’ils peuvent générer des textes variés et de haute qualité. Cependant, ils peuvent souffrir de biais et d’inexactitudes dans les données de formation, conduisant à des sorties inappropriées ou erronées. De plus, la quantité massive de ressources informatiques et de données nécessaires pour former et exécuter ces modèles peut les rendre difficiles et coûteux pour certaines applications.

Applications de l’IA générative

Une illustration de deux mains et d'un cerveau.

L’IA générative est déjà utilisée dans une multitude de services populaires. Il y a le chatbot ChatGPT susmentionné, créé par OpenAI et son générateur d’images sœur DALL-E. Il existe également une multitude d’éditeurs d’images AI, notamment Lensa (iOS, Android), Wonder (iOS, Android), etc. Ceux-ci existent tous depuis un certain temps. Mais lorsque ChatGPT a décollé, la Silicon Valley a décidé qu’il était temps de libérer la nouvelle technologie et a annoncé un nouveau produit d’IA après l’autre.

Depuis le début de cette année, Microsoft et Google ont tous deux annoncé des enchantements d’IA sur leurs moteurs de recherche. Suivi peu de temps après par les plus petits moteurs de recherche DuckDuck Go et Brave. Microsoft a ajouté la génération d’images AI à Bing et Edge, ainsi que des composants AI à sa suite bureautique. Même Opera ajoute ChatGPT à son navigateur de bureau. De plus, Shutterstock et Adobe ont sorti des générateurs d’art IA formés sur le travail des utilisateurs rémunérés.

Mais l’IA générative peut aller bien au-delà des créateurs d’images, des chatbots et des assistants de recherche. Les professionnels de tous horizons peuvent utiliser ces outils dans leur travail. L’IA générative a des applications potentielles dans la conception de produits, permettant aux entreprises de créer des produits personnalisés adaptés aux besoins de chaque client. De plus, il peut être utilisé par les professionnels de la santé en aidant au développement de diagnostics et de traitements.

De plus, l’IA générative peut créer du contenu personnalisé, comme des articles de presse ou des listes de lecture musicales. En analysant les préférences et le comportement d’un utilisateur, les algorithmes d’IA générative peuvent générer du contenu adapté à ses intérêts, augmentant ainsi l’engagement et la satisfaction des utilisateurs. L’IA générative peut aider à créer de nouveaux contenus pour l’industrie du divertissement, tels que des scripts de films ou des niveaux de jeux vidéo. La possibilité de générer des produits uniques mais similaires permet aux entreprises de créer plus de contenu plus rapidement et de meilleure qualité.

Ce n’est que la pointe de l’iceberg en ce qui concerne les applications potentielles de l’IA générative. La technologie pourrait également trouver des endroits utiles dans de nombreuses autres industries et professions. Il ne serait pas hyperbolique de comparer cette technologie, lorsqu’elle est mise en œuvre à grande échelle, à l’invention de la presse à imprimer ou au développement de la chaîne de montage en termes de la façon dont elle pourrait transformer la façon dont nous créons et consommons du contenu et effectuons nos travaux.

Risques potentiels et considérations éthiques

Un crâne dans un flux numérique de uns et de zéros.

Bien entendu, toute nouvelle technologie comporte le risque qu’elle soit mal utilisée ou avoir un impact négatif sur certains groupes. L’une des principales préoccupations concernant l’IA générative est qu’elle pourrait déplacer les écrivains, les artistes et d’autres types de créatifs qui gagnent leur vie en créant des articles, de l’art, des scripts, des livres, etc. Un autre inconvénient potentiel de l’IA générative est qu’elle pourrait être utilisée pour créer des contrefaçons profondes de célébrités et de politiciens qui seraient impossibles à distinguer des vidéos et des images de personnes réelles et les utiliser pour tromper le public. Et, bien sûr, il y a toujours la question de la science-fiction de savoir ce qui se passe si nous permettons à l’IA de commencer à prendre des décisions sans surveillance humaine appropriée. Va-t-il se retourner contre ses créateurs ou prendre des décisions qui nuisent aux humains, pensant que cela les aidera ?

La bonne nouvelle est que la plupart des questions éthiques entourant l’IA sont des préoccupations permanentes du progrès technologique. La destruction d’emplois accompagne presque toujours les progrès de l’automatisation. Mais il est également livré avec des outils plus avancés pour ceux qui restent fidèles au métier. Les écrivains, artistes et autres créateurs ont désormais un assistant puissant à utiliser pour les aider dans leurs vocations, pas nécessairement pour les détruire. De plus, la falsification d’images de célébrités et d’hommes politiques existe depuis les premiers logiciels de retouche photo. Et nous nous préparons à la prise de contrôle de l’IA dans les films depuis avant le premier Terminateur film. Et bien qu’il s’agisse de questions et de préoccupations valables, elles seront probablement résolues d’une manière qui profite à tout le monde ou du moins traitées d’une manière qui n’implique pas une perte massive d’emplois et l’arrivée d’un gouvernement suzerain de l’IA.

Cependant, un énorme problème que de nombreux produits d’IA devront surmonter est le droit d’auteur. Étant donné que l’IA générative est formée sur un ensemble de données massif de textes, d’images, de sons, etc., le matériel protégé par le droit d’auteur constitue une partie distincte de ce dont l’IA générative tire pour créer de nouvelles créations. Certes, la nature de l’IA générative empêche une recréation mot à mot exacte d’une œuvre protégée par le droit d’auteur, mais tout ce que l’IA générative crée est composé de morceaux de matériel protégé par le droit d’auteur. Ou du moins l’IA a appris à écrire et à dessiner sur la base des travaux des humains. Cela pourrait conduire à des poursuites judiciaires potentielles de la part d’écrivains et d’artistes qui estiment que leur travail a été volé pour former l’IA et qu’ils méritent une compensation ou exigent que l’IA « oublie » ce qu’elle a appris de leur travail.

Mais on pourrait faire valoir que l’IA n’est pas un travail protégé par copie par cœur et que l’apprentissage automatique équivaut à l’apprentissage humain, tout comme si un écrivain lisait un livre et s’en inspirait pour écrire le sien dans le même sens. Cela se résumera probablement à une bataille judiciaire où un juge devra décider, « quelle est la différence entre une IA qui apprend en imitant et un humain qui le fait ? » Et ce n’est que la pointe de l’iceberg lorsqu’il s’agit de démêler toutes les implications juridiques que l’IA générative soulèvera sûrement. Ce serait le bon moment pour les avocats de se perfectionner en informatique.

Réflexions finales : bienvenue dans le futur

L’IA générative peut être aussi effrayante qu’impressionnante et fascinante. Mais c’est ici maintenant, et ça ne va pas disparaître. Compte tenu du taux d’adoption au cours des premiers mois de 2023, il n’est pas difficile de prédire que d’ici la fin de l’année, l’IA générative sera intégrée à une grande partie de votre vie quotidienne. Et d’ici la fin de 2024, il sera peut-être difficile de se souvenir de la vie sans cette technologie.

★★★★★