Que signifie concrètement « Custom Tools » dans ce variant ?

Il s'agit d'une extension des capacités de function calling permettant de définir et d'invoquer des outils personnalisés avec une interface structurée. Cela facilite l'intégration d'APIs, de bases de données et de services externes au sein d'un agent.

La fenêtre de contexte de 1M tokens est-elle vraiment exploitable ?

Oui, elle permet d'ingérer des bases de code entières ou de longs corpus documentaires en une seule requête. Attention toutefois aux coûts et à la latence qui augmentent rapidement avec la taille du contexte.

Comment se compare-t-il aux autres variants de Gemini 3.1 Pro ?

Il partage le socle de raisonnement de Gemini 3.1 Pro mais se distingue par une architecture de tool-use enrichie. C'est essentiellement un terrain d'expérimentation pour les futures évolutions de l'orchestration d'outils.

Quels cas d'usage tirent le meilleur parti de ce modèle ?

Les agents autonomes, l'automatisation de workflows complexes et les assistants techniques nécessitant l'accès à de multiples services externes. Toute application combinant long contexte et orchestration d'outils en profite particulièrement.

Tier C — Spécialiste

Fonctionne en :USCréé en :United States

Google Gemini

Gemini 3.1 Pro Preview Custom Tools

Tier C — Spécialiste · 1.048576M tokens

Équipe éditoriale Tokonomix·Relu par Mes Kalkan·Publié le 22 mai 2026·Dernière relecture 26 mai 2026

Gemini 3.1 Pro Preview Custom Tools est une version expérimentale du modèle Gemini 3.1 Pro de Google intégrant des capacités étendues d'utilisation d'outils. Cette variante s'adresse aux développeurs et chercheurs explorant l'appel de fonctions avancé et l'intégration d'outils externes dans des applications de grands modèles de langage. Elle permet au modèle d'interagir avec des API personnalisées, des bases de données et des services externes via une interface structurée d'appel d'outils, ce qui la rend adaptée à la construction d'agents IA complexes et de systèmes d'automatisation de workflows. Le modèle dispose d'une fenêtre de contexte d'environ 1,048 million de tokens, lui permettant de traiter et maintenir des conversations, documents ou chaînes de raisonnement multi-étapes extrêmement longs. Cette capacité étendue s'avère particulièrement utile pour les applications nécessitant l'analyse de bases de code volumineuses, la revue documentaire exhaustive ou les sessions de dialogue prolongées. Le modèle offre des capacités standard de génération de texte aux côtés de ses fonctionnalités améliorées d'utilisation d'outils, prenant en charge à la fois les applications d'IA conversationnelle et les implémentations orientées tâches nécessitant l'accès à des données externes ou l'exécution d'actions. Au sein de la gamme de modèles de Google, cette variante se positionne comme une version preview spécialisée du palier Gemini 3.1 Pro, située entre les modèles de production standard et les versions expérimentales de pointe. Elle offre aux développeurs un accès anticipé à l'architecture évolutive d'utilisation d'outils de Google tout en conservant les capacités fondamentales de raisonnement et de génération de la base Gemini 3.1 Pro. La mention « Preview » indique qu'il s'agit d'une version préalable destinée aux tests et retours plutôt qu'à un déploiement en production.

Gemini 3.1 Pro Preview Custom Tools s'adresse aux équipes qui veulent pousser l'orchestration d'outils externes au-delà des appels de fonctions classiques. Son immense fenêtre de contexte en fait un terrain de jeu privilégié pour les agents autonomes complexes.
— Synthèse éditoriale Tokonomix

Section 01

Historique des tarifs

Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.

💰

Tarifs API — Gemini 3.1 Pro Preview Custom Tools

$2.00 par 1M de tokens d'entrée

$12.00 par 1M de tokens de sortie

≈ $0.0036 par conversation typique (800 tokens)

Prix entrée vs sortie (par 1M de tokens)

par 1M de tokens d'entrée$2.00

par 1M de tokens de sortie$12.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.00

input / 1M

— stable

$12.00

output / 1M

— stable

2026-05-242026-06-212026-07-19

Input

Output

Price change

⟳ synced weekly

Section 02

Forces & faiblesses

Basé sur les résultats de benchmarks et les retours communautaires agrégés sur des cas d'usage réels.

Forces

Appels d'outils personnalisés étendusFenêtre de contexte d'environ 1M tokensAdapté aux agents IA complexesIntégration fluide d'APIs externesRaisonnement multi-étapes solideAnalyse de bases de code volumineusesInterface de tool-calling structuréeAccès anticipé aux nouveautés Google

Faiblesses

Statut preview, stabilité non garantieCapacités multimodales non documentéesTier C : performances brutes intermédiairesDisponibilité régionale potentiellement limitée

Section 03

Capacités

toolssource: litellmvisionjson modepdf inputreasoningaudio inputjson schemaprompt cachingoutputTokenLimit: 65536max output tokens: 65536

Section 04

Questions fréquentes

Non, son statut de preview expérimentale le destine plutôt au prototypage et à la R&D. Pour des charges de production stables, mieux vaut s'orienter vers une version GA de Gemini Pro.

Un aperçu prometteur pour les architectes d'agents IA, à condition d'accepter son statut expérimental et ses garanties de stabilité limitées. À réserver aux prototypes ambitieux plutôt qu'aux charges de production critiques.
— Verdict Tokonomix

Section 05

Disponibilité

Pas encore de données

Nous n'avons pas encore enregistré suffisamment d'appels API pour afficher les statistiques de disponibilité de ce modèle. Les données apparaîtront dès que le modèle reçoit du trafic en direct.

Section 06

Verdicts benchmark Tokonomix

⚖️

Endorsed by 1 judge

Independent LLM judges evaluated this model on our weekly intelligence tests

claude-sonnet-4-544/100 · 91 runs

31 correct12 partial48 wrong34% accuracy

● 2026-07-19

New multimodal model with comprehensive tooling and input format support

Gemini 3.1 Pro Preview Custom Tools represents a substantial capability expansion for Google's model lineup. This release introduces eight new capabilities that were previously unavailable: tools, vision, JSON mode, PDF input, reasoning, audio input, JSON schema, and prompt caching. The model now supports a comprehensive multimodal experience, accepting text, images, audio, and PDF documents as inputs. The addition of custom tools and structured output formats through JSON mode and JSON schema makes this variant particularly suited for integration into complex workflows and applications requiring deterministic outputs. The reasoning capability suggests enhanced analytical performance, though specific benchmark comparisons are not available given this is the first window of data collection. Prompt caching support indicates optimization for repeated interactions and cost efficiency in production deployments. As a preview release, users should expect this model to undergo refinement, but the breadth of capabilities positions it as a versatile option for developers needing multimodal understanding combined with tool use and structured generation. The simultaneous addition of multiple major features represents one of the more comprehensive single-release expansions in recent model updates.

Quality

—

Latency p50

—

Test runs

✓ Eight new capabilities added✓ Full multimodal input support✓ Custom tools and JSON schema✓ Prompt caching enabled

Section 07

Profil complet du modèle

Gemini 3.1 Pro Preview Custom Tools : le spécialiste des boucles d'agents

Note — profil prospectif. Gemini 3.1 Pro Preview Custom Tools (gemini-3.1-pro-preview-customtools) est un instantané de prévisualisation. Le comportement, les capacités et les limites de débit vont évoluer avant la disponibilité générale.

Une variante spécialisée de 3.1 Pro Preview construite pour les charges de travail qui reposent fortement sur l'intégration structurée d'outils. Une fenêtre de contexte de 1 048 576 tokens. Entrée texte-plus-vision. La même surface de capacités sous-jacente que la 3.1 Pro Preview de base, plus un comportement d'utilisation d'outils amélioré calibré pour les boucles d'agents en production.

Si vous avez construit un système d'agents au-dessus d'un modèle Gemini de premier plan et que vous vous êtes retrouvé à écrire des couches d'analyse défensives autour des sorties d'appels d'outils, cette variante est construite pour votre situation.

Ce que « Custom Tools » apporte réellement

La variante Custom Tools est le même modèle sous-jacent avec un entraînement spécifique et un réglage au moment de l'inférence pour l'intégration d'outils. Les différences par rapport à la 3.1 Pro Preview de base apparaissent dans :

Des charges utiles d'appels d'outils plus fiables sous des schémas complexes. La 3.1 Pro Preview de base est déjà solide ici ; la variante Custom Tools est encore plus solide.
Une meilleure gestion des longues chaînes de résultats d'outils où le modèle doit interpréter la sortie d'un outil pour décider quel outil appeler ensuite.
Une récupération d'erreur plus propre quand un outil renvoie un résultat inattendu ou échoue complètement. Le modèle est plus susceptible de reconnaître le mode d'échec et soit de réessayer avec ajustement, soit d'escalader proprement.
Une meilleure adhésion aux politiques d'utilisation d'outils — instructions sur quand appeler les outils, quand demander à l'utilisateur, quand refuser, quand reporter.
Une visibilité de raisonnement plus cohérente quand l'agent décide entre plusieurs options d'outils.

La 3.1 Pro Preview de base couvre la plupart des charges de travail. La variante Custom Tools est pour les charges de travail où l'amélioration marginale de la fiabilité des boucles d'agents importe suffisamment pour justifier le modèle spécialisé.

Ce qu'il fait bien

Hérite des forces sous-jacentes de 3.1 Pro Preview. La fenêtre de contexte d'1M avec une qualité d'attention qui se maintient en profondeur. Gestion multimodale solide. Profondeur de raisonnement de premier plan. Entrée vision native.

Par-dessus cela, le raffinement de l'utilisation d'outils. Les boucles d'agents en production qui nécessitaient auparavant des couches d'analyse défensives, des harnais de nouvelle tentative ou une ingénierie de schéma minutieuse tendent à fonctionner plus proprement dès le départ sur cette variante.

Le profil de latence est similaire à la 3.1 Pro Preview de base. Le réglage Custom Tools n'ajoute pas de surcharge de latence significative.

Ce qu'il fait moins bien

Les considérations de niveau prévisualisation s'appliquent. Les limites de débit, la disponibilité régionale et les comportements spécifiques peuvent évoluer avant la disponibilité générale.

Pour les charges de travail qui ne reposent pas fortement sur l'intégration d'outils, la variante Custom Tools offre une valeur marginale par rapport à la 3.1 Pro Preview de base. Le réglage spécialisé est construit pour les charges de travail lourdes en outils ; pour les cas d'usage de forme conversationnelle ou orientés extraction, la variante de base est le bon point de départ.

Le coût par appel au niveau Pro est significatif. Pour les boucles d'agents à haut volume, le calcul économique dépend de si les améliorations de fiabilité compensent la dépense à l'échelle.

Le déploiement auto-hébergé n'est pas disponible. Google ne distribue pas les poids de Gemini.

Où il excelle

Quelques charges de travail où la variante Custom Tools gagne son positionnement spécialisé :

Boucles d'agents en production qui orchestrent de nombreux appels d'outils par tâche et nécessitent une haute fiabilité à travers la chaîne.
Écosystèmes d'outils complexes avec des schémas profondément imbriqués où l'adhésion au schéma sous pression compte.
Flux de travail où les sorties d'outils sont elles-mêmes complexes et où le modèle doit les interpréter soigneusement pour décider quoi faire ensuite.
Systèmes d'agents avec des politiques d'utilisation d'outils strictes — quand appeler les outils, quand reporter, quand escalader — où l'adhésion à ces politiques compte pour la conception opérationnelle.
Cas d'usage où le coût d'un échec de boucle d'agent est suffisamment élevé pour que l'amélioration marginale de fiabilité justifie le modèle spécialisé.

Où c'est le mauvais outil

Charges de travail qui n'utilisent pas fortement les outils. La 3.1 Pro Preview de base est le bon point de départ — même surface de modèle, applicabilité plus large.

Charges de travail en production qui nécessitent un comportement stable aujourd'hui. La 2.5 Pro de base couvre solidement l'utilisation d'outils pour la plupart des charges de travail ; la variante Custom Tools au niveau prévisualisation n'est pas encore le bon choix pour les boucles d'agents critiques en production.

Travail de classification à haut volume bon marché ou avec prompts courts. Le calcul de premier plan est une dépense de mauvaise forme pour ces charges de travail, quelle que soit la variante.

Tout ce qui sort de l'entrée texte-plus-vision. La voix, l'audio, la vidéo sont des familles de modèles différentes.

Comment il se compare aux alternatives

Par rapport à la 3.1 Pro Preview de base. La variante Custom Tools est une amélioration marginale sur la fiabilité d'utilisation d'outils pour les charges de travail lourdes en outils. Pour le travail non lourd en outils, la variante de base est le bon choix.

Par rapport à 2.5 Pro avec prompting personnalisé d'utilisation d'outils. Pour les charges de travail où vous avez déjà investi dans une ingénierie de prompt soigneuse et une analyse défensive autour du comportement d'utilisation d'outils de 2.5 Pro, le calcul de migration dépend de si la variante Custom Tools vous permet de simplifier significativement cette architecture environnante.

Par rapport à Claude Opus avec utilisation d'outils activée. Opus a son propre comportement solide d'utilisation d'outils avec la posture de refus de style Anthropic. Pour les charges de travail où le raisonnement attentif de style Opus convient mieux, c'est le bon choix. Pour les charges de travail où la sortie plus rapide et plus directe de Gemini convient mieux, la variante Custom Tools est le choix plus orienté boucle d'agent.

Par rapport au top-tier OpenAI avec sorties structurées et appel de fonctions. Les deux écosystèmes ont fortement investi dans la fiabilité d'utilisation d'outils. Le choix se résume souvent à l'adéquation à l'écosystème plutôt qu'à la capacité brute.

Le tableau au niveau de la catégorie vit sur /benchmarks/leaderboard.

Modèles pratiques

Quelques points à connaître avant de construire sur la variante Custom Tools :

La conception de schéma compte autant que le choix de modèle. Même un modèle d'utilisation d'outils solide bénéficie de schémas clairs et bien typés avec documentation explicite des champs.
Les descriptions d'outils dans le prompt système portent un poids réel. Les descriptions vagues produisent une sélection d'outils incohérente ; les descriptions spécifiques avec exemples produisent un comportement plus fiable.
Les longues boucles d'agents bénéficient toujours de compteurs d'étapes explicites et de mécanismes de réinitialisation. Même les modèles solides se coincent occasionnellement dans des boucles de nouvelle tentative ; construisez pour cela.
Le modèle gère les échecs d'outils plus gracieusement que la variante de base, mais les systèmes en aval devraient toujours s'attendre à des sélections d'outils occasionnellement incorrectes. Construisez la vérification là où cela compte.
Pour les charges de travail qui mélangent utilisation d'outils avec vision ou raisonnement à long contexte, la variante Custom Tools hérite des forces sous-jacentes de 3.1 Pro Preview sur les deux dimensions.

Notes de déploiement

API Google Gemini standard. La variante Custom Tools utilise la même surface que la 3.1 Pro Preview de base, avec la même forme de paramètre pour l'intégration d'outils.

La disponibilité régionale suit le modèle Vertex AI standard de Google. Les régions UE sont disponibles sur contrats entreprise. L'accès API consommateur prêt à l'emploi n'épingle pas de région.

La tarification au niveau prévisualisation ne devrait pas être la base de modélisation des coûts à long terme. La structure de tarification à disponibilité générale peut différer des tarifs au niveau prévisualisation.

Pour la planification de migration en production, validez le comportement Custom Tools contre votre écosystème d'outils spécifique. Les améliorations par rapport à la variante de base apparaissent le plus clairement dans les charges de travail lourdes en outils ; la validation devrait tester ces scénarios spécifiques.

Le choisir

Optez pour Gemini 3.1 Pro Preview Custom Tools quand :

La charge de travail est une boucle d'agent en production avec intégration lourde d'outils.
Le comportement d'utilisation d'outils de la 3.1 Pro Preview de base est bon mais vous avez besoin de l'amélioration marginale de fiabilité.
Les limites de débit et considérations de comportement au niveau prévisualisation sont acceptables.
Le coût des échecs de boucle d'agent est suffisamment élevé pour justifier le modèle spécialisé.

Choisissez autre chose quand :

La charge de travail ne repose pas fortement sur l'intégration d'outils. Utilisez la 3.1 Pro Preview de base.
Vous avez besoin d'un comportement stable en production aujourd'hui. Utilisez 2.5 Pro avec prompting soigné d'utilisation d'outils.
La charge de travail est sensible aux coûts à l'échelle. Descendez vers une variante Flash.
Vous avez besoin d'un déploiement auto-hébergé ou ajusté finement.

Le résumé. Variante spécialisée de 3.1 Pro Preview pour charges de travail d'agents lourdes en outils. Pour les charges de travail spécifiques où la spécialisation compte, c'est le bon choix. Pour tout le reste, la 3.1 Pro Preview de base ou 2.5 Pro est le meilleur point de départ.

Testez-le contre votre propre boucle d'agent sur /live-test. Les deltas apparaissent le plus clairement dans des scénarios réels d'utilisation d'outils plutôt que dans des benchmarks synthétiques.

Dernière révision technique : 2026-05-22 — Tokonomix.ai

Dernier test automatisé

21 juin 2026 · 04:57 UTC · Benchmark

Latence P50

7298 ms

Latence P95

—

Erreurs

0 / 6 exécutions

Dernière revue par Équipe Tokonomix·26 mai 2026