Aller au contenu
Tier C — Spécialiste
Fonctionne en :USCréé en :United States
Google Gemini

Gemini 3.1 Pro Preview

Tier C — Spécialiste · 1.048576M tokens

Équipe éditoriale Tokonomix·Relu par Mes Kalkan··

Gemini 3.1 Pro Preview est un grand modèle de langage développé par Google dans le cadre de la famille de modèles Gemini. Ce modèle représente une version préliminaire expérimentale de la génération 3.1, positionnée entre les modèles de production standard de Google et les variantes de recherche de pointe. Il est conçu pour les tâches de génération de texte à usage général, notamment la compréhension du langage naturel, le raisonnement, la création de contenu et les applications conversationnelles. La caractéristique technique la plus notable du modèle est sa fenêtre de contexte de 1 048 576 tokens, équivalant à environ un million de tokens de capacité de traitement. Cette longueur de contexte étendue permet au modèle de traiter des quantités substantielles d'informations en une seule interaction, ce qui le rend adapté aux tâches impliquant de longs documents, des bases de code volumineuses ou des conversations nécessitant un contexte historique important. Le modèle fournit des capacités standard de génération de texte sans fonctionnalités multimodales telles que le traitement d'images ou l'appel de fonctions. Au sein de la gamme de modèles Google, Gemini 3.1 Pro Preview constitue une offre intermédiaire qui permet aux développeurs et chercheurs de tester de nouvelles capacités avant leur disponibilité générale. En tant que version préliminaire, il peut présenter des caractéristiques de performance différentes par rapport aux modèles de production stables et pourrait faire l'objet de modifications ou d'améliorations en fonction des retours des utilisateurs. Le modèle s'adresse aux utilisateurs qui nécessitent de grandes fenêtres de contexte pour des applications textuelles et sont disposés à travailler avec une technologie en phase préliminaire.

Gemini 3.1 Pro Preview se distingue par sa fenêtre de contexte exceptionnelle d'un million de tokens, offrant aux développeurs une capacité rare de traiter des documents volumineux dans une seule interaction.

Analyse Tokonomix
Section 01

Analyse de vitesse

Latence mesurée sur toutes les exécutions de benchmark. P50 (médiane) et P95 (95e percentile) donnent une image réaliste de la vitesse de réponse en charge normale et de pointe.

Latence P50 (médiane)Latence P9514 runs
1188277243575941752505-2705-31ms
Section 02

Scores de qualité

Résultats d'évaluation issus des notations du modèle juge sur diverses catégories de tâches. Les scores reflètent la cohérence, la précision et le suivi des instructions.

50
Génération de code
29
Multilingue
15
Raisonnement
Section 03

Historique des tarifs

Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.

💰
Tarifs API — Gemini 3.1 Pro Preview
$2.00 par 1M de tokens d'entrée
$12.00 par 1M de tokens de sortie
≈ $0.0036 par conversation typique (800 tokens)
Prix entrée vs sortie (par 1M de tokens)
par 1M de tokens d'entrée$2.00
par 1M de tokens de sortie$12.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.00

input / 1M

— stable

$12.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Section 04

Tokens par seconde

Débit en tokens par seconde, dérivé de la latence P50 mesurée. Plus haut est mieux ; les fluctuations reflètent la charge côté fournisseur.

Débit (tokens / s)132 / avg 127
16795

Estimé à partir de la latence P50 × 200 tokens de sortie — le chiffre absolu dépend de cette hypothèse ; c'est la tendance qui compte.

Section 05

Forces & faiblesses

Basé sur les résultats de benchmarks et les retours communautaires agrégés sur des cas d'usage réels.

Forces

Fenêtre de contexte d'un million de tokensAccès anticipé aux innovations de rechercheTraitement de documents très volumineuxConversations avec historique étenduAnalyse de bases de code complètesIntégration dans l'écosystème Google CloudGénération de texte polyvalenteRaisonnement sur contenus complexes

Faiblesses

Statut prévisualisation implique possibles changementsAbsence de capacités multimodalesClassement Tier C en performancePas d'appel de fonctions disponible
Section 06

Capacités

toolssource: litellmvisionjson modepdf inputreasoningaudio inputjson schemaprompt cachingoutputTokenLimit: 65536max output tokens: 65536
Section 07

Questions fréquentes

Gemini 3.1 Pro Preview est une version expérimentale qui permet de tester de nouvelles capacités avant leur disponibilité générale. Il peut présenter des comportements différents et évoluer selon les retours utilisateurs, contrairement aux modèles de production qui sont stables.

Pour les équipes prêtes à adopter une technologie en prévisualisation, ce modèle offre un compromis intéressant entre capacité contextuelle massive et accessibilité d'usage, particulièrement adapté aux applications nécessitant l'analyse de longues transcriptions ou de bases de code étendues.

Évaluation Tokonomix
Section 08

Disponibilité

Disponibilité

La fréquence à laquelle ce modèle répond lorsqu'on l'appelle — mesurée sur de vraies requêtes API et des tests en direct au cours des 30 derniers jours. C'est indépendant de la qualité : ces chiffres indiquent seulement si le modèle répond, pas la qualité de sa réponse.

7 derniers jours

100.0%

n=1

30 derniers jours

100.0%

n=1

Temps de réponse médian

16,761ms

n=1

Basé sur 6 mesures au cours des 30 derniers jours.

Détails techniques

Seuls les vrais appels API et les requêtes de test en direct sont comptés — les sondes internes et les benchmarks sont exclus.

Les appels avec une clé API personnalisée (BYOK) sont exclus : ces échecs sont spécifiques à la clé, pas un signe de défaillance du modèle.

Les appels échoués ne sont PAS inclus dans les scores de qualité — la qualité est mesurée uniquement sur les réponses réussies. Disponibilité et qualité sont des signaux indépendants.

Temps de réponse médian (p50) sur les appels réussis avec une durée enregistrée. Les valeurs extrêmes influencent moins la médiane que la moyenne.

Total des appels (30d)

1

Réponses OK (30d)

1

Total des appels (7d)

1

Réponses OK (7d)

1

Section 09

Verdicts benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-548/100 · 76 runs
30 correct8 partial38 wrong39% accuracy
2026-06-14

Gemini 3.1 Pro Preview adds multimodal capabilities without benchmarks

Gemini 3.1 Pro Preview has undergone a significant expansion in capabilities since the previous evaluation period. The model now supports a comprehensive suite of features including vision, audio input, PDF processing, reasoning modes, and structured output formats through both JSON mode and JSON schema. Tool calling and prompt caching have also been added to the platform's feature set. However, no benchmark performance data is available for either the current or previous evaluation windows, making it impossible to assess the model's actual performance on standard tasks or compare quality metrics across time. The addition of multimodal inputs represents a substantial architectural evolution, positioning the model to handle diverse use cases from document analysis to audio processing. Users should note that while the capability expansion is impressive on paper, the absence of benchmark results means performance characteristics remain unvalidated. For production deployments, organizations will need to conduct their own evaluations to understand how these new capabilities perform in practice and whether quality has been maintained, improved, or degraded during this significant feature expansion.

Quality

Latency p50

Test runs

0

Vision and audio input added PDF processing now supported Structured output modes available No benchmark data available
Section 10

Profil complet du modèle

Gemini 3.1 Pro Preview — illustration 1
Gemini 3.1 Pro Preview : le niveau supérieur de nouvelle génération

Note — profil prospectif. Gemini 3.1 Pro Preview (gemini-3.1-pro-preview) est un instantané de préversion. Le comportement, les capacités et les limites de taux évolueront avant la disponibilité générale.

Le modèle d'entrée de niveau supérieur de nouvelle génération dans la famille Gemini de Google. Une fenêtre de contexte de 1 048 576 tokens. Entrée texte-plus-vision. Une profondeur de raisonnement qui fait avancer la ligne Pro par rapport à la génération 2.5 Pro tout en conservant la surface architecturale sur laquelle les équipes en production ont construit.

Le cadrage qui convient à cette préversion : 3.1 Pro est ce vers quoi vous vous tournez quand 2.5 Pro est le modèle de production que vous faites confiance mais que vous avez une charge de travail spécifique où la qualité a été le facteur limitant. La génération 3.1 comble une partie de cet écart. La pertinence de cette fermeture pour justifier la migration depuis un déploiement 2.5 Pro fonctionnel dépend de votre situation spécifique.

Ce qui a changé depuis 2.5 Pro

La génération Pro 3.1 apporte plusieurs améliorations sur 2.5 Pro :

  • Un raisonnement plus acéré sur les tâches multi-étapes. Les chaînes de pensée restent cohérentes plus loin en profondeur, et le modèle est moins susceptible de perdre le fil des contraintes intermédiaires dans les problèmes complexes.
  • Une meilleure qualité d'attention long-contexte en profondeur. La fenêtre 1M était utilisable sur 2.5 Pro ; sur 3.1 Pro, la qualité de synthèse au-delà de 400 000 tokens d'entrée est nettement plus rigoureuse.
  • Une meilleure adhérence aux sorties structurées sur les schémas imbriqués complexes. Les payloads d'appels d'outils sont plus fiables.
  • Une meilleure qualité vision sur les documents denses et les graphiques complexes.
  • Une posture de refus plus cohérente avec un raisonnement suffisamment visible pour déboguer un faux positif.

Aucun de ces points n'est individuellement transformateur. L'effet composé est un niveau supérieur qui fait davantage ce qu'un niveau supérieur devrait faire.

Ce qu'il fait bien

La combinaison phare reste la même que 2.5 Pro : une fenêtre de contexte d'un million de tokens avec une qualité d'attention qui tient en profondeur. La génération 3.1 fait progresser les deux dimensions.

Le raisonnement multi-étapes est l'amélioration la plus visible. Les tâches que 2.5 Pro pouvait gérer avec un prompt engineering soigneux fonctionnent maintenant avec des prompts plus simples. Les tâches que 2.5 Pro ne pouvait pas gérer de façon cohérente produisent maintenant une sortie plus fiable.

La qualité vision est améliorée par rapport à 2.5 Pro. Captures d'écran de documents, PDF scannés, tableaux de bord, graphiques, diagrammes — gérés avec plus de soin sur les sources denses ou complexes. L'extraction de tableaux est plus fiable. La description de graphiques inclut des estimations de grandeur plus précises.

La fiabilité des appels d'outils est suffisante pour construire des boucles d'agent en production sans parsing défensif. L'amélioration sur 2.5 Pro est progressive plutôt que transformatrice, mais elle compte à grande échelle.

Ce qu'il fait mal

Les considérations de niveau préversion s'appliquent. Pour les charges de travail en production nécessitant un comportement stable aujourd'hui, 2.5 Pro reste le choix le plus conservateur.

La latence au niveau Pro est plus élevée qu'aux niveaux Flash, comme attendu. La génération 3.1 ne change pas ce compromis fondamental ; vous payez la profondeur de raisonnement en temps réel.

Le coût par appel au niveau Pro est significatif. Pour les charges de travail à volume élevé, le cas pour rester sur Pro dépend de si votre charge nécessite genuinement la qualité de niveau supérieur.

Le déploiement auto-hébergé n'est pas au programme. Google ne livre pas les poids Gemini.

Positionnement face à la concurrence

Face aux instantanés Pro précédents — 2.5 Pro. La préversion 3.1 est l'upgrade naturel pour les nouveaux projets où un comportement de niveau préversion est acceptable. Pour les déploiements en production existants sur 2.5 Pro, le cas de migration dépend de si les améliorations comptent pour votre charge spécifique.

Face au niveau supérieur d'Anthropic. Claude Opus 4.7 offre la même fenêtre 1M avec un style de raisonnement différent — plus prudent, plus explicite, plus lent. Le choix entre Opus 4.7 et 3.1 Pro Preview se résume à si vous voulez le raisonnement prudent de style Opus ou la sortie plus rapide de style Gemini avec un traitement multimodal solide.

Face au niveau supérieur d'OpenAI. GPT-5 rivalise sur le raisonnement et est souvent plus rapide sur les prompts courts. 3.1 Pro Preview gagne sur le multimodal natif au-delà des images et sur l'utilisation significative de la fenêtre 1M pour la synthèse.

Le tableau par catégorie est sur /benchmarks/leaderboard et les scores par catégorie sur /benchmarks/intelligence.

Différence avec 3.1 Pro Preview Custom Tools

Le variant Custom Tools de 3.1 Pro Preview ajoute des capacités d'appels d'outils spécialisées pour les charges de travail qui reposent fortement sur l'intégration d'outils structurés. Pour les charges de travail où le comportement standard des appels d'outils est suffisant, ce variant de base est le bon point de départ. Pour celles qui nécessitent l'intégration d'outils spécialisée, le variant Custom Tools est le choix.

Quand l'adopter

Choisissez Gemini 3.1 Pro Preview quand :

  • Vous explorez les capacités de niveau supérieur de nouvelle génération pour un déploiement futur en production.
  • La charge de travail était contrainte par 2.5 Pro sur la profondeur de raisonnement ou la synthèse long-contexte.
  • Les limites de taux et les considérations de comportement de niveau préversion sont acceptables pour votre volume de trafic.
  • Vous êtes déjà sur la pile Google.

Choisissez autre chose quand :

  • Vous avez besoin d'un comportement stable en production aujourd'hui. Utilisez 2.5 Pro.
  • La charge de travail serait adéquatement servie par un variant Flash. Descendez pour le coût.
  • Le travail nécessite une entrée audio-native, une voix en temps réel ou de la vidéo.
  • Vous avez besoin d'une cohérence de refus correspondant au style Anthropic Opus.

En résumé. Un fort instantané de niveau supérieur de nouvelle génération qui avance significativement sur 2.5 Pro. Pour l'exploration en préversion et la conception prospective, c'est le bon point de départ. Pour les déploiements stables en production aujourd'hui, 2.5 Pro reste le choix conservateur jusqu'à ce que la ligne 3.x atteigne la disponibilité générale.

Testez les mêmes prompts sur 2.5 Pro et 3.1 Pro Preview à /live-test. Les écarts ressortent le mieux en comparaison directe sur votre propre charge de travail.

Dernière vérification technique : 2026-05-22 — Tokonomix.ai

Gemini 3.1 Pro Preview — illustration 2
Dernier test automatisé
14 juin 2026 · 04:55 UTC · Benchmark
Latence P50
6937 ms
Latence P95
Erreurs
0 / 6 exécutions
Dernière revue par Équipe Tokonomix·24 mai 2026