Trois mois après le lancement de Gemini 3 Pro, Google accélère déjà. Avec Gemini 3.1 Pro, l’entreprise introduit un système inédit de raisonnement ajustable à trois niveaux, capable de moduler sa profondeur d’analyse selon la complexité de la tâche. Cette évolution transforme le modèle en une version allégée de Deep Think, activable à la demande. Pour les entreprises, cela pourrait simplifier considérablement l’architecture des déploiements IA.
Un système de raisonnement à trois niveaux pour adapter la puissance à chaque tâche
La grande nouveauté de Gemini 3.1 Pro repose sur l’introduction de trois niveaux de “thinking” : faible, moyen et élevé.
Jusqu’ici, Gemini 3 Pro proposait uniquement deux modes, faible et élevé. La version 3.1 ajoute un niveau intermédiaire, équivalent à l’ancien mode élevé, et redéfinit totalement le mode le plus puissant. En configuration maximale, le modèle se comporte comme une version compacte de Gemini Deep Think, le système spécialisé de Google dédié au raisonnement avancé.
Concrètement, cela permet aux entreprises d’utiliser un seul modèle tout en ajustant dynamiquement l’effort de calcul. Une tâche simple, comme un résumé de document, peut être traitée en mode faible pour privilégier la rapidité. Une analyse stratégique complexe peut activer le mode élevé afin de mobiliser un raisonnement plus long et plus structuré.
Cette approche évite de rediriger les requêtes vers plusieurs modèles spécialisés, ce qui simplifie l’architecture technique et réduit la charge opérationnelle.
Des performances en forte hausse sur les benchmarks de raisonnement
Les chiffres publiés par Google montrent une progression nette par rapport à la génération précédente, en particulier sur les tests de raisonnement abstrait et les capacités agentiques.
Sur ARC-AGI-2, un benchmark mesurant la capacité à résoudre des problèmes abstraits inédits, Gemini 3.1 Pro atteint 77,1 %, contre 31,1 % pour Gemini 3 Pro. Le modèle dépasse également Claude Sonnet 4.6 avec 58,3 %, Claude Opus 4.6 à 68,8 % et GPT-5.2 à 52,9 %.
Sur Humanity’s Last Exam, un test académique exigeant, la nouvelle version obtient 44,4 % sans outils, contre 37,5 % auparavant. Sur GPQA Diamond, consacré aux connaissances scientifiques, elle atteint 94,3 %, ce qui la place en tête des modèles comparés.
Ces résultats confirment un bond significatif dans les tâches nécessitant une compréhension approfondie et une capacité à résoudre des problèmes nouveaux.
Des progrès majeurs pour les usages agentiques en entreprise
Les améliorations sont particulièrement visibles sur les benchmarks liés aux systèmes capables d’utiliser des outils et d’exécuter des tâches en plusieurs étapes.
Sur Terminal-Bench 2.0, qui évalue le codage en environnement terminal, Gemini 3.1 Pro obtient 68,5 %, contre 56,9 % pour la version précédente. Sur MCP Atlas, un test mesurant les workflows multi-étapes via le Model Context Protocol, le score grimpe à 69,2 %, soit 15 points de plus qu’avec Gemini 3 Pro. Enfin, sur BrowseComp, dédié à la recherche web agentique, le modèle atteint 85,9 %, contre 59,2 % auparavant.
Ces performances sont stratégiques pour les entreprises qui déploient des agents capables d’interagir avec des systèmes, d’enchaîner des actions et de manipuler des outils de manière autonome.
Pourquoi Google parle d’une version 3.1 et non d’un nouveau modèle
Le choix de la numérotation est révélateur. En adoptant l’appellation 3.1, Google indique qu’il s’agit d’une évolution majeure tout en restant dans la continuité de la version 3 Pro.
L’entreprise précise que cette mise à jour s’appuie sur les enseignements tirés de la série Deep Think. Les gains observés sur les benchmarks de raisonnement et de codage suggèrent un recours renforcé à l’apprentissage par renforcement, particulièrement efficace pour optimiser les performances sur des tâches structurées.
Le modèle est pour l’instant proposé en preview. Google prévoit d’améliorer encore les capacités liées aux workflows agentiques avant un déploiement en disponibilité générale.
Une nouvelle pression concurrentielle sur le marché des modèles IA
Avec Gemini 3.1 Pro, Google reprend l’avantage sur plusieurs indicateurs clés. Cette mise à jour pourrait pousser les autres acteurs majeurs à réagir rapidement.
Pour les décideurs technologiques, la question dépasse le simple choix d’un modèle. Elle concerne aussi la capacité à s’adapter à un rythme d’innovation qui s’intensifie. Disposer d’un modèle unique capable d’ajuster son niveau de raisonnement en temps réel pourrait devenir un atout stratégique dans la construction des futures architectures IA.
