La famille de modèles Gemini 2.5 de Google est déjà là
Résumé
-
Gemini 2.5 Pro présente le premier modèle complet de la chaîne de pensées de Google.
-
Le nouveau modèle de Google excellera dans le raisonnement, le codage et les tâches de résolution de problèmes.
-
Gemini 2.5 est maintenant disponible pour une utilisation expérimentale par les utilisateurs de Gemini Advanced.
Cela ne fait pas trop longtemps que Google a publié sa famille de modèles Gemini 2.0, mais la société va déjà de l'avant avec la prochaine. Google vient d'annoncer la famille Gemini 2.5, en commençant par Gemini 2.5 Pro. Cela semble précipité, mais nous le permettons.
Google vient d'annoncer l'introduction de Gemini 2.5, sa nouvelle génération de modèles d'intelligence artificielle. Le déploiement initial présente la version expérimentale de Gemini 2.5 Pro, que la société positionne comme un progrès significatif dans les capacités de raisonnement et de codage de l'IA par rapport à Gemini 2.0 et même par rapport aux modèles concurrents.
La grande chose à noter ici est que Gemini 2.5 est le premier modèle complet « chaîne de pensées » de Google, ce qui signifie qu'il effectue une pensée en plusieurs étapes et vérifie ses réponses de précision avant de les sortir. Gemini 2.0 l'a déjà soutenu avec le modèle de pensée Flash 2.0 (qui est également expérimental), mais Gemini 2.5 n'est pas du tout disponible dans une version non-chaîne. Il faudra parfois plus de temps pour répondre aux questions, mais les réponses seront plus précises et, espérons-le, nous aurons également moins d'hallucinations – il s'avère que c'est toujours un énorme problème avec l'IA, même avec la façon dont les modèles avancés de grande langue ont été avancés.
En rapport
Les modèles Gemini 2.0 de Google arrivent pour tout le monde
Plus intelligent et plus rapide.
Les gains générationnels que Google prétend ici semblent assez bons. Dans les domaines nécessitant un raisonnement avancé, la société affirme que Gemini 2.5 Pro fonctionne assez bien sur des références telles que GPQA (Q&A à l'épreuve des diplômés Google) et AIME 2025 (problèmes d'examen American Invitational Mathematics). En outre, il aurait marqué 18,8% sur le dernier examen de l'humanité, un ensemble de données difficile conçu par des experts en la matière, lorsqu'il est testé sans utilisation externe d'outils. Le modèle a également fait ses débuts en position supérieure sur le classement LMarena, une plate-forme qui classe les modèles d'IA basés sur des évaluations des préférences humaines, assis au-dessus des modèles récemment publiés comme GPT 4.5 d'OpenAI ou Grok 3 de Xai.
Google affirme que Gemini 2.5 Pro fonctionne très bien en ce qui concerne la génération d'applications Web, le code agentique (code conçu pour effectuer des tâches de manière autonome), la transformation du code et l'édition. Sur la référence vérifiée SWE-Bench, qui évalue les compétences de codage agentique, Gemini 2.5 Pro a obtenu un score de 63,8% en utilisant une configuration d'agent personnalisée. Pour afficher davantage ses capacités, la société a même déclaré que le modèle était capable de générer du code exécutable pour un jeu vidéo à partir d'une invite unique. J'ai essayé exactement cela la semaine dernière lorsque la nouvelle fonctionnalité Canvas a été publiée et qu'elle a été nul, je devrais donc réessayer avec le nouveau modèle pour voir si c'est vrai.
Gemini 2.0 a été publié pour la première fois publiquement fin janvier, donc cela n'a même pas fait deux mois complets depuis la publication de cette famille de modèles particulière. En tant que note amusante, Google a également complètement frotté la version expérimentale de Gemini 2.0 Pro et l'a remplacée par Gemini 2.5, donc à moins que la version stable de ce modèle arrive bientôt, nous pourrions techniquement dire que la famille Gemini 2.0 de courte durée n'avait pas de modèle stable « avancé ». Oui, nous avons déménagé rapidement. Avec tous ceux qui souhaitent revendiquer le trône de l'IA pour eux-mêmes et la concurrence, les entreprises libérant des modèles en succession rapide deviendront probablement une vue de plus en plus courante.
Le modèle est actuellement disponible dans une étape expérimentale pour les utilisateurs avancés de Gemini, donc si vous avez un abonnement, vous pouvez l'essayer à partir de maintenant. Si vous ne le voyez pas encore, cela pourrait prendre quelques jours de plus pour apparaître. Nous ne savons pas quand nous verrons cela devenir stable, ou quand nous pourrions voir un modèle Flash Gemini 2.5 plus petit pour les utilisateurs gratuits.