Qu'est-ce qu'un grand modèle de langage ? La technologie LLM qui alimente GenAI expliquée
Les grands modèles linguistiques, également connus sous le nom de LLM, sont la technologie qui alimente une grande partie de la technologie GenAI avancée que nous voyons sur les ordinateurs portables, les téléphones et d'autres technologies en 2024 – mais qu'est-ce qu'un LLM et que fait-il exactement ?
Essentiellement, les LLM sont un type d'intelligence artificielle entraînée sur des gigaoctets (sinon des téraoctets ou des pétaoctets) de données pour interpréter le langage humain et générer des résultats sous forme de texte, d'audio, d'images et bien plus encore – mais il y a bien plus que cela.
Nous expliquons ici tout ce que vous devez savoir sur les grands modèles linguistiques et comment ils alimentent les chatbots populaires comme ChatGPT et Google Gemini.
Sommaire
Qu'est-ce qu'un grand modèle de langage ?
Dans sa forme la plus simple, un Large Language Model (également connu sous le nom de LLM) est un type d'intelligence artificielle capable de reconnaître et de générer du texte – bien que les LLM puissent également se spécialiser dans des éléments tels que la génération de photos, la génération de vidéos, la création musicale et bien plus encore. Il s'agit essentiellement de la technologie sous-jacente qui alimente les outils d'IA générative tels que ChatGPT, Google Gemini et Microsoft Copilot.
Pour accomplir cette tâche, les LLM sont formés sur des ensembles de données absolument massifs – d'où leur nom – et utilisent l'apprentissage automatique pour comprendre ce qui leur est demandé et générer quelque chose de nouveau sur cette base.
Pour le contexte, la plupart des LLMS sont formés sur des données trouvées sur Internet, peut-être des millions de gigaoctets de texte provenant de tous les coins du Web, afin d'obtenir autant d'informations que possible.
Cependant, la qualité des échantillons aura un impact sur la manière dont le LLM remplira ses fonctions, de sorte que les LLM spécialisés pourront utiliser un ensemble de données plus organisé. Par exemple, un LLM formé exclusivement sur des données en langue française ne serait pas capable de générer une histoire en anglais, et vice versa.
Obtenez un combiné iPhone 14 Plus remis à neuf pour seulement 529 £
Obtenez un combiné iPhone 14 Plus remis à neuf dans un état « comme neuf » auprès de Giffgaff pour seulement 529 £ aujourd'hui. Giffgaff explique que ses téléphones « comme neufs » ne présentent aucune rayure visible et ont été minutieusement inspectés pour garantir un état de fonctionnement à 100 %.
- Giffgaff
- Etat 'Comme neuf'
- 529 £
Voir l'offre
Pour quoi pouvez-vous utiliser les grands modèles de langage ?
Comme indiqué précédemment, les LLM sont l'épine dorsale des assistants d'IA générative que nous avons vu apparaître au cours des dernières années, de ChatGPT à Google Gemini et pratiquement tous les autres outils GenAI auxquels vous pouvez penser.
Alors que les utilisations potentielles de GenAI et, par conséquent, des LLM sont en constante expansion, l’itération actuelle semble se concentrer sur plusieurs domaines clés.
Le plus évident est la rédaction ; Les chatbots basés sur LLM comme ChatGPT peuvent rédiger une copie entièrement originale basée sur une description que vous donnez. Cela peut aller d'un petit livre pour enfants à un guide étape par étape pour cuisiner le steak parfait en fonction de ce que vous lui demandez de faire.
De même, les LLM sont également parfaits pour répondre aux requêtes sur un produit spécifique, appelé réponse à la base de connaissances.
Il s’agit essentiellement du moment où une entreprise forme un LLM exclusivement sur son produit ou service, que les consommateurs peuvent ensuite utiliser pour répondre à des questions simples (et complexes) sans avoir à chercher sur le Web ou à parler à une personne réelle. C'est pratique non seulement pour en savoir plus sur un produit avant de l'acheter, mais peut également être utile pour dépanner ledit produit une fois acheté.
Les LLM ont également été une bouée de sauvetage pour les codeurs, générant du code dans une variété de langages de codage basés sur les descriptions des développeurs. Vous ne pourrez pas créer une nouvelle application ou un nouveau jeu entièrement en utilisant ChatGPT sans au moins une connaissance passable du codage, mais cela peut vous faire gagner énormément de temps.
Et puis il y a le plus gros ; génération d'images. Il s’agit probablement de l’utilisation la plus controversée des services GenAI basés sur LLM à l’heure actuelle, car vous pouvez essentiellement demander à l’IA de créer tout ce que vous décrivez.
C'est très bien jusqu'à ce que vous pénétriez dans les eaux troubles de la désinformation et que vous puissiez facilement créer de fausses nouvelles virales en utilisant simplement des générateurs d'images alimentés par l'IA. Les outils basés sur l'image les plus populaires ont des limites quant aux types d'images qu'ils peuvent générer, mais les personnes particulièrement dévouées peuvent souvent trouver un moyen de contourner ces limitations.
Quelles sont certaines des limites des grands modèles linguistiques ?
Les grands modèles linguistiques peuvent faire beaucoup de bien, mais il convient de noter qu'il existe certaines limites à la technologie telle qu'elle est.
Le plus gros problème actuel avec les chatbots basés sur LLM est l’hallucination. Il s'agit d'un terme relativement nouveau dans le monde de l'intelligence artificielle, mais il signifie essentiellement que les LLM créent de fausses informations lorsqu'ils ne peuvent pas produire de réponse précise. Cela peut être dû au fait que le LLM n'a pas été formé sur cet ensemble de données spécifique, mais cela peut parfois se produire lors de conversations régulières avec un chatbot.
C'est pourquoi il est important d'avoir au moins une connaissance passagère de ce que vous demandez à des LLM comme ChatGPT de décrire ou de créer. Un codeur chevronné, par exemple, pourrait repérer des hallucinations dans le code généré, tandis qu'un débutant le prendrait au pied de la lettre et le collerait directement dans son projet, tandis qu'une personne intéressée par les téléphones remarquerait une spécification inexacte si elle interrogeait un LLM sur une nouvelle version.
Il y a aussi la question de la vie privée ; certains utilisateurs peuvent télécharger de la documentation confidentielle ou inclure des informations confidentielles dans leurs requêtes, mais les LLM utilisent les informations qu'ils reçoivent pour une formation continue. Cela signifie que des informations confidentielles peuvent être exposées en réponse aux questions et requêtes d'autres utilisateurs.