Name: Tremplin Numérique
Price range: $$$

Google pousse encore plus loin ses ambitions en matière d'IA avec Gemini 3, son modèle le plus performant à ce jour, et qui vise à apporter bien plus que des réponses de chat plus intelligentes.

Annoncée parallèlement à un vaste déploiement dans la recherche, l'application Gemini et ses outils de développement, la mise à jour marque le plus grand progrès de Google depuis le début de l'ère Gemini il y a près de deux ans.

Selon les propres recherches et tests internes de Google, Gemini 3 est conçu pour comprendre un contexte plus profond, raisonner avec plus de nuances et gérer des tâches beaucoup plus complexes avec moins d'invites. Le PDG Sundar Pichai affirme que le modèle rapproche Google de l'AGI, grâce à une combinaison d'une compréhension multimodale améliorée, de capacités agents plus fortes et d'une augmentation majeure de la puissance de raisonnement brut.

Au centre du lancement se trouve Gemini 3 Pro, maintenant en avant-première, qui surpasse Gemini 2.5 Pro sur tous les principaux benchmarks. Il est actuellement en tête du classement LM Arena avec un score Elo de 1 501 et affiche des résultats frappants : 37,5 % au Humanity's Last Exam, le test de raisonnement interne sans outil de Google ; 91,9 % sur GPQA Diamant ; et un nouveau 23,4 % de pointe sur le benchmark MathArena Apex.

Les tests de Google montrent également de grands progrès dans le raisonnement multimodal, avec 81 % sur MMMU-Pro et 87,6 % sur Video-MMMU, ainsi qu'une précision factuelle améliorée à 72,1 % sur SimpleQA Verified.

Réfléchissez profondément

Un nouveau mode Deep Think pousse ces capacités encore plus loin. Dans les premières évaluations de Google, Deep Think obtient des scores encore plus élevés, dont 93,8 % sur GPQA Diamond et un niveau frontière de 45,1 % sur ARC-AGI-2 (avec exécution de code). Google déclare qu'il retient Deep Think de la diffusion générale pour un examen de sécurité supplémentaire avant de le mettre à la disposition des abonnés Gemini Ultra.

Gemini 3 ne vise pas uniquement les interactions de type chat. Il est conçu pour aider les utilisateurs à apprendre, à construire et à planifier de manière plus pratique, en utilisant sa fenêtre contextuelle plus grande d'un million de jetons et un traitement multimodal plus avancé. Cela implique de transformer des recettes familiales manuscrites en un livre de cuisine numérique, d'analyser de longues vidéos académiques et de générer du matériel d'étude interactif, ou même de revoir des séquences de jeu pour produire des plans de formation.

Pour les développeurs, Gemini 3 arrive dans Google AI Studio, Vertex AI, Gemini CLI et la nouvelle plateforme Google Antigravity – un environnement de développement axé sur l'agent dans lequel Gemini peut planifier, exécuter et valider des tâches de codage en plusieurs étapes. Les benchmarks internes de Google montrent des progrès majeurs dans les performances des agents, notamment les meilleurs scores sur WebDev Arena (1 487 Elo), Terminal-Bench 2.0 (54,2 %) et SWE-bench Verified (76,2 %).

Je viens chercher

Gemini 3 commence également son déploiement dans la recherche via le mode AI, où Google utilise le modèle pour générer des mises en page visuelles dynamiques, des simulations et des réponses plus contextuelles à la volée.

Comme toujours, Google souligne que cela repose sur ses propres tests. La société affirme que Gemini 3 est son modèle le plus rigoureusement évalué à ce jour, avec une flagornerie réduite, des défenses plus solides contre les injections rapides et des audits externes étendus, y compris des évaluations de UK AISI, Apollo, Vaultis et Dreadnode.

Gemini 3 est désormais disponible dans l'application Gemini et dans les outils de développement de Google, avec davantage de modèles et de fonctionnalités, notamment Deep Think, qui devraient arriver dans les semaines à venir.