Qu’est-ce que Google Gemini ? L’IA de nouvelle génération pour combattre ChatGPT expliquée
Jusqu’à récemment, vous n’aviez peut-être pas entendu parler de Google Gemini, mais le chatbot Bard de Google s’est peut-être glissé dans votre atmosphère. Mais un switcheroo a remis les projecteurs sur les Gémeaux et vous en entendrez sûrement parler de plus en plus dans les années à venir.
Le modèle Gemini 1.0, initialement présenté en avant-première lors du Google I/O en mai, est plus puissant que la technologie existante et potentiellement mieux équipé pour affronter le modèle ChatGPT d’OpenAI utilisé par Microsoft. Les tests de Google indiquent qu’il est plus puissant.
Cela fait partie du contexte clé, mais entrons dans les bases.
Sommaire
Qu’est-ce que Google Gemini ?
Le 8 février 2024, Google a annoncé que Bard deviendrait désormais Gemini, le chatbot adoptant le nom du modèle d’IA qui l’alimente. En tant que tel, Google Gemini fait désormais référence à la fois au modèle et au chatbot destiné au public.
Google affirme que Gemini est son « modèle d’IA le plus grand et le plus performant » et qu’il sera responsable de tout alimenter, de Bard à la gamme de smartphones Google Pixel.
L’entreprise affirme que la clé de Gemini et du modèle d’IA « multimodal ». Cela signifie qu’il peut « généraliser et comprendre, fonctionner et combiner de manière transparente différents types d’informations, notamment le texte, le code, l’audio, l’image et la vidéo ». Les itérations précédentes obtenaient des capacités plus limitées en assemblant les modèles. Gemini est nativement multimodal.
Trois tailles différentes pour les Gémeaux
Google affirme que Gemini 1.0 est la première version du modèle, comme le suggère la convention de numérotation. Il existe des niveaux conçus à des fins différentes. Tous bénéficient de la conception multimodale et leurs objectifs sont détaillés ci-dessous.
Nano, par exemple, sera idéal pour l’IA sur appareil et sera bientôt disponible sur le Pixel 8 Pro, tandis qu’Ultra est conçu pour les cas d’utilisation extrêmes comme les centres de données. Pro est le juste milieu, sur lequel Bard va être alimenté à partir d’aujourd’hui.
- Gemini Ultra — notre modèle le plus grand et le plus performant pour les tâches très complexes.
- Gemini Pro : notre meilleur modèle pour évoluer sur un large éventail de tâches.
- Gemini Nano — notre modèle le plus efficace pour les tâches sur appareil.
Disponibilité
Gemini Pro est disponible dans Google Bard depuis décembre et reste la valeur par défaut pour une utilisation standard de Google Gemini, tandis que Gemini Nano a été lancé sur le Pixel 8 Pro dans le cadre de la fonctionnalité Drop de décembre.
Économisez 23 % sur la Google Pixel Watch 2
La Google Pixel Watch 2 vient d’atteindre son prix le plus bas à ce jour, en baisse de 23 % pour atteindre un prix de 270 £.
- Amazone
- Économisez 23 %
- Maintenant 270 £
Voir l’offre
Google ajoute : « Nous apportons également Gemini au Pixel. Le Pixel 8 Pro est le premier smartphone conçu pour exécuter Gemini Nano, qui intègre de nouvelles fonctionnalités telles que Summaride dans l’application Recorder et le déploiement de Smart Reply dans Gboard, en commençant par WhatsApp – avec d’autres applications de messagerie à venir l’année prochaine.
Le 8 février, Google a lancé Gemini Advanced, permettant aux utilisateurs d’accéder au modèle Ultra 1.0. Google affirme qu’il s’agit du « modèle d’IA de pointe le plus vaste et le plus performant ». Advanced vise à aborder des tâches plus complexes telles que le codage, le raisonnement logique, le suivi d’instructions nuancées et la collaboration sur des projets créatifs. Ultra 1.0 comprend également mieux le contexte, sur la base des conversations précédentes. Gemini Advanced est disponible en anglais dans 150 pays et territoires. Il sera étendu à davantage de langues à l’avenir.
Vous pouvez accéder à Google Gemini Advanced en vous inscrivant au forfait Google One AI Premium. Le forfait coûte 18,99 £/mois (19,99 $/mois). En plus de l’accès à Gemini Advanced, vous bénéficiez de 2 To de stockage Google Drive et d’un « accès à d’autres avantages Google One ».
Gemini et Gemini Advanced sont déployés sur Android via l’Assistant Google, vous permettant de choisir entre les modèles d’IA et l’Assistant standard. Pour iOS, Gemini est déployé dans l’application Google.
Des performances surhumaines
Google affirme que les performances de Gemini ont été rigoureusement testées sur des tâches telles que l’image naturelle, la compréhension audio et vidéo et le raisonnement mathématique. Gemini Ultra bat les modèles existants sur 30 des 32 critères académiques pour les grands modèles de langage.
Désormais, selon Google, Gemini surpasse les experts humains sur 57 sujets en matière de MMLU (compréhension massive du langage multitâche). Gemini a obtenu un score de 90,0 % à ces tests, tandis que ChatGPT 4 a obtenu un score de 86,4 %. C’est un élément clé à retenir.
Comment et pourquoi la nouvelle génération a été construite
Google affirme avoir abordé la formation de Gemini différemment des fonctionnalités multimodales précédentes. Auparavant, ils étaient formés séparément et regroupés ensuite. Cela signifiait qu’il était bon pour décrire des images, par exemple, mais qu’il lui manquait la capacité de raisonner de manière complexe et compétente.
Google affirme que Gemini a été pré-entraîné dès le début pour être nativement multimodal, ce qui entraîne une mise à niveau massive.
« Ensuite, nous l’avons affiné avec des données multimodales supplémentaires pour affiner davantage son efficacité », explique la société dans le billet de blog. « Cela aide Gemini à comprendre et à raisonner de manière transparente sur toutes sortes d’entrées à partir de la base, bien mieux que les modèles multimodaux existants – et ses capacités sont à la pointe de la technologie dans presque tous les domaines. »