Aller au contenu
Tier C — Spécialiste
Fonctionne en :USCréé en :United States
Google Gemini

Gemini 3.1 Pro Preview Custom Tools

Tier C — Spécialiste · 1.048576M tokens

Équipe éditoriale Tokonomix·Relu par Mes Kalkan··

Gemini 3.1 Pro Preview Custom Tools est une version expérimentale du modèle Gemini 3.1 Pro de Google intégrant des capacités étendues d'utilisation d'outils. Cette variante s'adresse aux développeurs et chercheurs explorant l'appel de fonctions avancé et l'intégration d'outils externes dans des applications de grands modèles de langage. Elle permet au modèle d'interagir avec des API personnalisées, des bases de données et des services externes via une interface structurée d'appel d'outils, ce qui la rend adaptée à la construction d'agents IA complexes et de systèmes d'automatisation de workflows. Le modèle dispose d'une fenêtre de contexte d'environ 1,048 million de tokens, lui permettant de traiter et maintenir des conversations, documents ou chaînes de raisonnement multi-étapes extrêmement longs. Cette capacité étendue s'avère particulièrement utile pour les applications nécessitant l'analyse de bases de code volumineuses, la revue documentaire exhaustive ou les sessions de dialogue prolongées. Le modèle offre des capacités standard de génération de texte aux côtés de ses fonctionnalités améliorées d'utilisation d'outils, prenant en charge à la fois les applications d'IA conversationnelle et les implémentations orientées tâches nécessitant l'accès à des données externes ou l'exécution d'actions. Au sein de la gamme de modèles de Google, cette variante se positionne comme une version preview spécialisée du palier Gemini 3.1 Pro, située entre les modèles de production standard et les versions expérimentales de pointe. Elle offre aux développeurs un accès anticipé à l'architecture évolutive d'utilisation d'outils de Google tout en conservant les capacités fondamentales de raisonnement et de génération de la base Gemini 3.1 Pro. La mention « Preview » indique qu'il s'agit d'une version préalable destinée aux tests et retours plutôt qu'à un déploiement en production.

Gemini 3.1 Pro Preview Custom Tools s'adresse aux équipes qui veulent pousser l'orchestration d'outils externes au-delà des appels de fonctions classiques. Son immense fenêtre de contexte en fait un terrain de jeu privilégié pour les agents autonomes complexes.

Synthèse éditoriale Tokonomix
Section 01

Analyse de vitesse

Latence mesurée sur toutes les exécutions de benchmark. P50 (médiane) et P95 (95e percentile) donnent une image réaliste de la vitesse de réponse en charge normale et de pointe.

Latence P50 (médiane)Latence P9514 runs
109741807263103451342805-2705-31ms
Section 02

Scores de qualité

Résultats d'évaluation issus des notations du modèle juge sur diverses catégories de tâches. Les scores reflètent la cohérence, la précision et le suivi des instructions.

43
Génération de code
27
Multilingue
45
Raisonnement
Section 03

Historique des tarifs

Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.

💰
Tarifs API — Gemini 3.1 Pro Preview Custom Tools
$2.00 par 1M de tokens d'entrée
$12.00 par 1M de tokens de sortie
≈ $0.0036 par conversation typique (800 tokens)
Prix entrée vs sortie (par 1M de tokens)
par 1M de tokens d'entrée$2.00
par 1M de tokens de sortie$12.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.00

input / 1M

— stable

$12.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Section 04

Tokens par seconde

Débit en tokens par seconde, dérivé de la latence P50 mesurée. Plus haut est mieux ; les fluctuations reflètent la charge côté fournisseur.

Débit (tokens / s)156 / avg 140
18189

Estimé à partir de la latence P50 × 200 tokens de sortie — le chiffre absolu dépend de cette hypothèse ; c'est la tendance qui compte.

Section 05

Forces & faiblesses

Basé sur les résultats de benchmarks et les retours communautaires agrégés sur des cas d'usage réels.

Forces

Appels d'outils personnalisés étendusFenêtre de contexte d'environ 1M tokensAdapté aux agents IA complexesIntégration fluide d'APIs externesRaisonnement multi-étapes solideAnalyse de bases de code volumineusesInterface de tool-calling structuréeAccès anticipé aux nouveautés Google

Faiblesses

Statut preview, stabilité non garantieCapacités multimodales non documentéesTier C : performances brutes intermédiairesDisponibilité régionale potentiellement limitée
Section 06

Capacités

toolssource: litellmvisionjson modepdf inputreasoningaudio inputjson schemaprompt cachingoutputTokenLimit: 65536max output tokens: 65536
Section 07

Questions fréquentes

Non, son statut de preview expérimentale le destine plutôt au prototypage et à la R&D. Pour des charges de production stables, mieux vaut s'orienter vers une version GA de Gemini Pro.

Un aperçu prometteur pour les architectes d'agents IA, à condition d'accepter son statut expérimental et ses garanties de stabilité limitées. À réserver aux prototypes ambitieux plutôt qu'aux charges de production critiques.

Verdict Tokonomix
Section 08

Disponibilité

Disponibilité

Pas encore de données

Nous n'avons pas encore enregistré suffisamment d'appels API pour afficher les statistiques de disponibilité de ce modèle. Les données apparaîtront dès que le modèle reçoit du trafic en direct.

Section 09

Verdicts benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-545/100 · 76 runs
29 correct7 partial40 wrong38% accuracy
2026-06-14

New model debuts with extensive multimodal capabilities

Gemini 3.1 Pro Preview Custom Tools enters benchmarking with a comprehensive feature set spanning multiple input modalities and output formats. The model supports tools, vision, audio input, PDF processing, and structured output through both JSON mode and JSON schema capabilities. Reasoning and prompt caching features are also available. Without previous benchmark data for comparison, this represents the model's initial capability profile rather than performance changes. Users gain access to a versatile multimodal system that handles diverse input types including text, images, audio, and documents. The custom tools designation suggests enhanced function calling capabilities for agentic workflows. The preview status indicates this is a pre-release version that may undergo further refinement. As this is the first benchmark window with data, performance characteristics across these capabilities remain to be validated through continued testing. Organizations evaluating this model should conduct their own assessments for specific use cases, particularly given its preview nature. Future benchmark windows will establish performance trends and stability metrics across the newly available feature set.

Quality

Latency p50

Test runs

0

Multimodal input support added Structured output capabilities enabled Tool calling functions available Prompt caching now supported
Section 10

Profil complet du modèle

Gemini 3.1 Pro Preview Custom Tools — illustration 1
Gemini 3.1 Pro Preview Custom Tools : le spécialiste des boucles d'agents

Note — profil prospectif. Gemini 3.1 Pro Preview Custom Tools (gemini-3.1-pro-preview-customtools) est un instantané de prévisualisation. Le comportement, les capacités et les limites de débit vont évoluer avant la disponibilité générale.

Une variante spécialisée de 3.1 Pro Preview construite pour les charges de travail qui reposent fortement sur l'intégration structurée d'outils. Une fenêtre de contexte de 1 048 576 tokens. Entrée texte-plus-vision. La même surface de capacités sous-jacente que la 3.1 Pro Preview de base, plus un comportement d'utilisation d'outils amélioré calibré pour les boucles d'agents en production.

Si vous avez construit un système d'agents au-dessus d'un modèle Gemini de premier plan et que vous vous êtes retrouvé à écrire des couches d'analyse défensives autour des sorties d'appels d'outils, cette variante est construite pour votre situation.

Ce que « Custom Tools » apporte réellement

La variante Custom Tools est le même modèle sous-jacent avec un entraînement spécifique et un réglage au moment de l'inférence pour l'intégration d'outils. Les différences par rapport à la 3.1 Pro Preview de base apparaissent dans :

  • Des charges utiles d'appels d'outils plus fiables sous des schémas complexes. La 3.1 Pro Preview de base est déjà solide ici ; la variante Custom Tools est encore plus solide.
  • Une meilleure gestion des longues chaînes de résultats d'outils où le modèle doit interpréter la sortie d'un outil pour décider quel outil appeler ensuite.
  • Une récupération d'erreur plus propre quand un outil renvoie un résultat inattendu ou échoue complètement. Le modèle est plus susceptible de reconnaître le mode d'échec et soit de réessayer avec ajustement, soit d'escalader proprement.
  • Une meilleure adhésion aux politiques d'utilisation d'outils — instructions sur quand appeler les outils, quand demander à l'utilisateur, quand refuser, quand reporter.
  • Une visibilité de raisonnement plus cohérente quand l'agent décide entre plusieurs options d'outils.

La 3.1 Pro Preview de base couvre la plupart des charges de travail. La variante Custom Tools est pour les charges de travail où l'amélioration marginale de la fiabilité des boucles d'agents importe suffisamment pour justifier le modèle spécialisé.

Ce qu'il fait bien

Hérite des forces sous-jacentes de 3.1 Pro Preview. La fenêtre de contexte d'1M avec une qualité d'attention qui se maintient en profondeur. Gestion multimodale solide. Profondeur de raisonnement de premier plan. Entrée vision native.

Par-dessus cela, le raffinement de l'utilisation d'outils. Les boucles d'agents en production qui nécessitaient auparavant des couches d'analyse défensives, des harnais de nouvelle tentative ou une ingénierie de schéma minutieuse tendent à fonctionner plus proprement dès le départ sur cette variante.

Le profil de latence est similaire à la 3.1 Pro Preview de base. Le réglage Custom Tools n'ajoute pas de surcharge de latence significative.

Ce qu'il fait moins bien

Les considérations de niveau prévisualisation s'appliquent. Les limites de débit, la disponibilité régionale et les comportements spécifiques peuvent évoluer avant la disponibilité générale.

Pour les charges de travail qui ne reposent pas fortement sur l'intégration d'outils, la variante Custom Tools offre une valeur marginale par rapport à la 3.1 Pro Preview de base. Le réglage spécialisé est construit pour les charges de travail lourdes en outils ; pour les cas d'usage de forme conversationnelle ou orientés extraction, la variante de base est le bon point de départ.

Le coût par appel au niveau Pro est significatif. Pour les boucles d'agents à haut volume, le calcul économique dépend de si les améliorations de fiabilité compensent la dépense à l'échelle.

Le déploiement auto-hébergé n'est pas disponible. Google ne distribue pas les poids de Gemini.

Où il excelle

Quelques charges de travail où la variante Custom Tools gagne son positionnement spécialisé :

  • Boucles d'agents en production qui orchestrent de nombreux appels d'outils par tâche et nécessitent une haute fiabilité à travers la chaîne.
  • Écosystèmes d'outils complexes avec des schémas profondément imbriqués où l'adhésion au schéma sous pression compte.
  • Flux de travail où les sorties d'outils sont elles-mêmes complexes et où le modèle doit les interpréter soigneusement pour décider quoi faire ensuite.
  • Systèmes d'agents avec des politiques d'utilisation d'outils strictes — quand appeler les outils, quand reporter, quand escalader — où l'adhésion à ces politiques compte pour la conception opérationnelle.
  • Cas d'usage où le coût d'un échec de boucle d'agent est suffisamment élevé pour que l'amélioration marginale de fiabilité justifie le modèle spécialisé.

Où c'est le mauvais outil

Charges de travail qui n'utilisent pas fortement les outils. La 3.1 Pro Preview de base est le bon point de départ — même surface de modèle, applicabilité plus large.

Charges de travail en production qui nécessitent un comportement stable aujourd'hui. La 2.5 Pro de base couvre solidement l'utilisation d'outils pour la plupart des charges de travail ; la variante Custom Tools au niveau prévisualisation n'est pas encore le bon choix pour les boucles d'agents critiques en production.

Travail de classification à haut volume bon marché ou avec prompts courts. Le calcul de premier plan est une dépense de mauvaise forme pour ces charges de travail, quelle que soit la variante.

Tout ce qui sort de l'entrée texte-plus-vision. La voix, l'audio, la vidéo sont des familles de modèles différentes.

Comment il se compare aux alternatives

Par rapport à la 3.1 Pro Preview de base. La variante Custom Tools est une amélioration marginale sur la fiabilité d'utilisation d'outils pour les charges de travail lourdes en outils. Pour le travail non lourd en outils, la variante de base est le bon choix.

Par rapport à 2.5 Pro avec prompting personnalisé d'utilisation d'outils. Pour les charges de travail où vous avez déjà investi dans une ingénierie de prompt soigneuse et une analyse défensive autour du comportement d'utilisation d'outils de 2.5 Pro, le calcul de migration dépend de si la variante Custom Tools vous permet de simplifier significativement cette architecture environnante.

Par rapport à Claude Opus avec utilisation d'outils activée. Opus a son propre comportement solide d'utilisation d'outils avec la posture de refus de style Anthropic. Pour les charges de travail où le raisonnement attentif de style Opus convient mieux, c'est le bon choix. Pour les charges de travail où la sortie plus rapide et plus directe de Gemini convient mieux, la variante Custom Tools est le choix plus orienté boucle d'agent.

Par rapport au top-tier OpenAI avec sorties structurées et appel de fonctions. Les deux écosystèmes ont fortement investi dans la fiabilité d'utilisation d'outils. Le choix se résume souvent à l'adéquation à l'écosystème plutôt qu'à la capacité brute.

Le tableau au niveau de la catégorie vit sur /benchmarks/leaderboard.

Modèles pratiques

Quelques points à connaître avant de construire sur la variante Custom Tools :

  • La conception de schéma compte autant que le choix de modèle. Même un modèle d'utilisation d'outils solide bénéficie de schémas clairs et bien typés avec documentation explicite des champs.
  • Les descriptions d'outils dans le prompt système portent un poids réel. Les descriptions vagues produisent une sélection d'outils incohérente ; les descriptions spécifiques avec exemples produisent un comportement plus fiable.
  • Les longues boucles d'agents bénéficient toujours de compteurs d'étapes explicites et de mécanismes de réinitialisation. Même les modèles solides se coincent occasionnellement dans des boucles de nouvelle tentative ; construisez pour cela.
  • Le modèle gère les échecs d'outils plus gracieusement que la variante de base, mais les systèmes en aval devraient toujours s'attendre à des sélections d'outils occasionnellement incorrectes. Construisez la vérification là où cela compte.
  • Pour les charges de travail qui mélangent utilisation d'outils avec vision ou raisonnement à long contexte, la variante Custom Tools hérite des forces sous-jacentes de 3.1 Pro Preview sur les deux dimensions.

Notes de déploiement

API Google Gemini standard. La variante Custom Tools utilise la même surface que la 3.1 Pro Preview de base, avec la même forme de paramètre pour l'intégration d'outils.

La disponibilité régionale suit le modèle Vertex AI standard de Google. Les régions UE sont disponibles sur contrats entreprise. L'accès API consommateur prêt à l'emploi n'épingle pas de région.

La tarification au niveau prévisualisation ne devrait pas être la base de modélisation des coûts à long terme. La structure de tarification à disponibilité générale peut différer des tarifs au niveau prévisualisation.

Pour la planification de migration en production, validez le comportement Custom Tools contre votre écosystème d'outils spécifique. Les améliorations par rapport à la variante de base apparaissent le plus clairement dans les charges de travail lourdes en outils ; la validation devrait tester ces scénarios spécifiques.

Le choisir

Optez pour Gemini 3.1 Pro Preview Custom Tools quand :

  • La charge de travail est une boucle d'agent en production avec intégration lourde d'outils.
  • Le comportement d'utilisation d'outils de la 3.1 Pro Preview de base est bon mais vous avez besoin de l'amélioration marginale de fiabilité.
  • Les limites de débit et considérations de comportement au niveau prévisualisation sont acceptables.
  • Le coût des échecs de boucle d'agent est suffisamment élevé pour justifier le modèle spécialisé.

Choisissez autre chose quand :

  • La charge de travail ne repose pas fortement sur l'intégration d'outils. Utilisez la 3.1 Pro Preview de base.
  • Vous avez besoin d'un comportement stable en production aujourd'hui. Utilisez 2.5 Pro avec prompting soigné d'utilisation d'outils.
  • La charge de travail est sensible aux coûts à l'échelle. Descendez vers une variante Flash.
  • Vous avez besoin d'un déploiement auto-hébergé ou ajusté finement.

Le résumé. Variante spécialisée de 3.1 Pro Preview pour charges de travail d'agents lourdes en outils. Pour les charges de travail spécifiques où la spécialisation compte, c'est le bon choix. Pour tout le reste, la 3.1 Pro Preview de base ou 2.5 Pro est le meilleur point de départ.

Testez-le contre votre propre boucle d'agent sur /live-test. Les deltas apparaissent le plus clairement dans des scénarios réels d'utilisation d'outils plutôt que dans des benchmarks synthétiques.

Dernière révision technique : 2026-05-22 — Tokonomix.ai

Gemini 3.1 Pro Preview Custom Tools — illustration 2
Dernier test automatisé
14 juin 2026 · 05:02 UTC · Benchmark
Latence P50
6069 ms
Latence P95
Erreurs
0 / 6 exécutions
Dernière revue par Équipe Tokonomix·26 mai 2026