Aller au contenu
Tier A — Frontier
Fonctionne en :USCréé en :United States
Google Gemini

Gemini 3 Pro Preview

Tier A — Frontier · 1.048576M tokens

Équipe éditoriale Tokonomix·Relu par Mes Kalkan··

Gemini 3 Pro Preview est un grand modèle de langage expérimental développé par Google dans le cadre de sa famille de systèmes d'IA Gemini. Cette version préliminaire vise à démontrer des capacités avancées dans les tâches standard de génération de texte, notamment le raisonnement complexe, la compréhension de contextes étendus et le traitement nuancé du langage naturel. Le modèle est positionné comme un aperçu de recherche, permettant aux développeurs et chercheurs d'explorer ses capacités avant un déploiement commercial plus large. La caractéristique technique la plus distinctive du modèle est sa fenêtre de contexte de 1,048,576 tokens — soit environ un million de tokens — qui lui permet de traiter et de maintenir la cohérence sur des documents, bases de code ou historiques de conversation extrêmement longs. Cette capacité de contexte étendue le place parmi les modèles les plus performants pour les tâches nécessitant l'analyse de documents volumineux, telles que la revue de documents juridiques, la compréhension exhaustive de code ou la synthèse multi-documents. Le modèle prend en charge les flux de travail standard de génération de texte, sans capacités multimodales spécialisées dans cette configuration. Au sein de la gamme de modèles de Google, Gemini 3 Pro Preview représente une itération avancée de la série Gemini Pro, offrant des performances accrues par rapport aux générations précédentes tout en restant axé sur les cas d'usage professionnels et destinés aux développeurs. En tant que version préliminaire, il sert de terrain d'essai pour des capacités susceptibles d'être ultérieurement intégrées aux modèles Gemini en production. Le modèle est accessible via l'infrastructure de plateforme d'IA de Google et s'adresse aux utilisateurs ayant besoin de capacités sophistiquées de compréhension et de génération du langage à grande échelle.

Gemini 3 Pro Preview établit une nouvelle référence pour le traitement de contextes ultra-longs, avec une fenêtre dépassant le million de tokens qui ouvre des possibilités inédites pour l'analyse documentaire à grande échelle.

Tokonomix - Analyse comparative des modèles
Section 01

Historique des tarifs

Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.

💰
Tarifs API — Gemini 3 Pro Preview
$2.00 par 1M de tokens d'entrée
$12.00 par 1M de tokens de sortie
≈ $0.0036 par conversation typique (800 tokens)
Prix entrée vs sortie (par 1M de tokens)
par 1M de tokens d'entrée$2.00
par 1M de tokens de sortie$12.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.00

input / 1M

— no change

$12.00

output / 1M

— no change

2026-05-242026-05-242026-05-24
Input
Output
Price change
⟳ synced weekly
Section 02

Forces & faiblesses

Basé sur les résultats de benchmarks et les retours communautaires agrégés sur des cas d'usage réels.

Forces

Fenêtre contextuelle d'un million de tokensRaisonnement complexe multi-étapesArchitecture de troisième génération optimiséeAnalyse de documents volumineux sans segmentationSynthèse cohérente sur longues conversationsNiveau A pour usage professionnelIntégration native à l'écosystème GoogleAccès anticipé aux innovations Gemini

Faiblesses

Statut expérimental sans garanties productionCoût élevé avec contextes maximauxAbsence de capacités multimodalesDocumentation limitée en phase preview
Section 03

Capacités

outputTokenLimit: 65536
Section 04

Questions fréquentes

Gemini 3 Pro Preview offre une fenêtre contextuelle significativement étendue et des capacités de raisonnement améliorées grâce à son architecture de troisième génération. En tant que version preview, il intègre des innovations expérimentales non encore disponibles dans les modèles en production stable.

Pour les équipes nécessitant une compréhension contextuelle exceptionnelle sur de vastes corpus textuels, Gemini 3 Pro Preview s'impose comme un choix stratégique, malgré son statut expérimental qui requiert une validation approfondie avant déploiement en production.

Tokonomix - Évaluation éditoriale
Section 05

Disponibilité

Disponibilité

Pas encore de données

Nous n'avons pas encore enregistré suffisamment d'appels API pour afficher les statistiques de disponibilité de ce modèle. Les données apparaîtront dès que le modèle reçoit du trafic en direct.

Section 06

Verdicts benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-544/100 · 67 runs
24 correct6 partial37 wrong36% accuracy
2026-05-24

Gains de latence significatifs compensés par une régression des capacités de raisonnement

Gemini 3 Pro Preview affiche une trajectoire de performance contrastée dans sa dernière fenêtre de benchmark. Le modèle enregistre une amélioration modeste de la qualité globale de 5,6 points pour atteindre 45,6 sur 100, ce qui reste néanmoins dans la moitié inférieure des plages de performance concurrentielles. Le fait le plus marquant est l'amélioration spectaculaire de la latence de 55 %, passant de 18,5 secondes à 8,4 secondes en médiane, soit un gain substantiel en temps de réponse que les utilisateurs remarqueront immédiatement. Toutefois, les gains de qualité masquent une volatilité significative au niveau des catégories. Le modèle conserve des scores parfaits sur les tâches créatives et de codage, démontrant de solides capacités dans ces domaines. L'exactitude factuelle progresse légèrement, passant de 50 à 55. L'évolution préoccupante est l'effondrement total des performances en raisonnement, chutant d'un honorable 75 à zéro sur la fenêtre actuelle. Par ailleurs, la catégorie zorg recule de 18 à 10, tandis que les capacités multilingues ne sont plus mesurées dans la suite de tests actuelle. La réduction du nombre d'exécutions de tests, passant de 28 à 11, suggère que ces résultats peuvent présenter une variance plus élevée et doivent être interprétés avec une certaine prudence. Les utilisateurs ayant besoin de solides capacités de raisonnement devraient évaluer attentivement si ce modèle répond à leurs besoins, tandis que ceux orientés vers les applications créatives ou de codage pourraient tirer parti de la vitesse améliorée et de la qualité maintenue dans ces domaines.

Quality

45.6

Latency p50

8,366 ms

Test runs

11

Latence améliorée de 55 % La création et le codage restent solides Le raisonnement est tombé à zéro Moins d'essais terminés
Section 07

Profil complet du modèle

Gemini 3 Pro Preview — illustration 1
Gemini 3 Pro Preview : le haut de gamme nouvelle génération de Google

Note — profil prospectif. Gemini 3 Pro Preview (gemini-3-pro-preview) est l'aperçu de nouvelle génération de la gamme Pro de Google. Le comportement, les capacités et les limites de débit évolueront avant la disponibilité générale.

L'aperçu phare de Google pour la ligne Pro 3.x. Une fenêtre de contexte de 1 048 576 tokens. Entrée texte plus vision. Le modèle qui trône au sommet de la gamme d'aperçu de Google et qui représente les capacités les plus actuelles que la famille Gemini ait livrées aux développeurs.

Si vous êtes sur 2.5 Pro et que vous avez des charges de travail spécifiques où la qualité a été le facteur limitant, c'est la mise à niveau à tester. C'est également le modèle à comparer aux derniers snapshots Anthropic Opus et OpenAI GPT-5 lorsque vous choisissez un modèle haut de gamme à frais en 2026.

Où ce snapshot se situe dans la gamme

L'état actuel de la gamme Pro dans la famille Gemini :

  • 2.5 Pro est le choix stable en production. Comportement bien compris, limites de débit établies, intégration mature avec l'ensemble de la surface Vertex AI.
  • 3 Pro Preview est l'aperçu de nouvelle génération. Capacités plus récentes, améliorations généralisées par rapport à 2.5 Pro, considérations propres au comportement d'aperçu.
  • 3.1 Pro Preview est le raffinement par-dessus 3 Pro Preview. La variante 3.1 corrige les aspérités que 3 Pro Preview a introduites. Plus proche de la direction que prend la ligne 3.x à la disponibilité générale.

Pour de nouvelles constructions dans la famille 3.x, 3.1 Pro Preview constitue habituellement le point de départ le plus actuel. Le 3 Pro Preview reste pertinent pour les charges de travail validées contre ce snapshot précis ou à des fins de comparaison et de benchmarking.

Ce qu'il fait bien

La génération Pro 3.x apporte des améliorations significatives par rapport au 2.5 Pro :

  • Raisonnement plus aiguisé sur les tâches multi-étapes. Les chaînes de pensée restent cohérentes plus profondément, et le modèle est moins susceptible de perdre la trace des contraintes intermédiaires dans des problèmes complexes.
  • Meilleure attention en contexte long en profondeur. La fenêtre 1M était utilisable sur 2.5 Pro ; sur 3 Pro Preview, la qualité de synthèse au-delà de 400k tokens d'entrée est sensiblement plus serrée.
  • Adhérence améliorée aux sorties structurées sur des schémas imbriqués complexes.
  • Qualité de vision renforcée sur les documents denses et les graphiques complexes.
  • Posture de refus plus cohérente avec un raisonnement suffisamment visible pour pouvoir déboguer un faux positif.

Les améliorations s'additionnent. L'effet composé donne un haut de gamme qui fait davantage de ce qu'un haut de gamme devrait faire.

La gestion multimodale est l'un des différenciateurs visibles face aux modèles frontière concurrents. La qualité native de la vision combinée à la fenêtre de contexte de 1M signifie que les charges de travail mêlant longs documents et images ou graphiques intégrés fonctionnent bien en un seul appel, sans nécessiter d'orchestration multi-étapes.

Ce qu'il fait mal

Les considérations de niveau aperçu s'appliquent. Les limites de débit, la disponibilité régionale et certains comportements spécifiques peuvent changer avant la disponibilité générale. Pour les charges de travail de production qui ont besoin d'un comportement stable aujourd'hui, 2.5 Pro reste le choix le plus conservateur.

Le 3.1 Pro Preview est le raffinement qui a comblé plusieurs aspérités dans ce snapshot 3 Pro Preview. Pour les charges de travail où ces raffinements comptent, la variante 3.1 est la meilleure cible actuelle.

La latence au niveau Pro est plus élevée qu'aux niveaux Flash, comme attendu. La génération 3.x ne change pas ce compromis fondamental.

Le coût par appel au niveau Pro est significatif. Pour les charges de travail à fort volume, l'argument du maintien sur Pro dépend de la question de savoir si votre charge de travail a véritablement besoin de la qualité haut de gamme.

Le déploiement auto-hébergé n'est pas au menu. Google ne livre pas les poids de Gemini. Pour les charges de travail nécessitant de l'on-prem, le tour d'horizon des poids ouverts à /usecases/local est le bon point de départ.

Comment il se positionne face à la concurrence

Face au haut de gamme Anthropic. Claude Opus 4.7 propose la même fenêtre de contexte de 1M avec un style de raisonnement différent. Opus est plus prudent, plus explicite, plus lent ; 3 Pro Preview est plus rapide avec une gestion multimodale native plus forte. Le choix dépend de la question de savoir si votre charge de travail privilégie le raisonnement minutieux à la mode Opus ou la sortie directe à la mode Gemini.

Face au haut de gamme OpenAI. GPT-5 rivalise sur le raisonnement et est souvent plus rapide sur les prompts courts. 3 Pro Preview l'emporte sur le multimodal natif au-delà des images et sur le fait que la fenêtre de contexte de 1M soit réellement utilisable pour la synthèse.

Face à la ligne Gemini. 2.5 Pro pour la stabilité en production. 3.1 Pro Preview pour la capacité d'aperçu la plus actuelle. Le 3 Pro Preview est le juste milieu en termes de récence et de raffinement.

La vue d'ensemble au niveau catégorie se trouve sur /benchmarks/leaderboard et les scores par catégorie sur /benchmarks/intelligence.

Là où ce n'est pas le bon outil

Les charges de travail de production qui ont besoin d'un comportement stable aujourd'hui. Utilisez 2.5 Pro.

Classification bon marché à fort volume. La puissance de calcul haut de gamme n'est pas la bonne forme de dépense pour envoyer des millions de prompts courts. Descendez vers une variante Flash.

Voix conversationnelle en temps réel. Pas d'entrée audio native. Le guide du pipeline vocal sur /usecases/voice couvre la bonne architecture.

Génération de code où l'intégration IDE de premier ordre compte plus que la profondeur de raisonnement. Le modèle est compétent en code mais non spécialisé. Le tour d'horizon des modèles à /usecases/code couvre les alternatives.

Tout ce qui demande une réponse en moins d'une seconde sur de grandes entrées. La latence en profondeur dans la fenêtre de contexte est réelle ; pour les applications sensibles au temps, des modèles plus petits avec des stratégies de cache peuvent mieux convenir.

Les charges de travail où les raffinements du 3.1 Pro Preview par rapport à ce snapshot 3 Pro importent. Utilisez directement 3.1 Pro Preview.

Schémas pratiques

Quelques éléments à connaître avant de construire sur 3 Pro Preview :

  • Pour les charges de travail combinant entrée en contexte long et vision, ce modèle gère bien les deux dimensions en un seul appel. Profitez-en plutôt que d'orchestrer des alternatives multi-étapes.
  • La mise en cache de prompts est le bon schéma pour les requêtes répétées sur le même grand corpus. Recharger 800k tokens à chaque appel est coûteux même quand l'API réussit.
  • Structurer une longue entrée avec des en-têtes de section clairs aide le modèle à trouver ce qui compte. L'attention en contexte long est bonne, pas magique.
  • L'utilisation d'outils est suffisamment fiable pour construire des boucles d'agent en production sans avoir à écrire des couches d'analyse défensive. Pour les charges de travail à forte utilisation d'outils, la variante 3.1 Pro Preview Custom Tools ajoute un réglage spécialisé.
  • Le comportement de niveau aperçu peut évoluer avant la disponibilité générale. Validez les contrats en aval contre les sorties du modèle et prévoyez la possibilité de changements.

Notes de déploiement

API Google Gemini standard. REST, streaming, utilisation d'outils, sortie structurée — tout se comporte comme attendu pour la surface de capacités du niveau Pro. L'intégration avec l'outillage Vertex AI plus large pour la supervision, la journalisation et les contrôles de sécurité est propre.

La disponibilité régionale suit le schéma standard de Vertex AI de Google. Les régions UE sont disponibles sur contrats entreprise. L'accès API grand public prêt à l'emploi n'épingle pas de région. Pour des contraintes strictes de résidence, la documentation régionale Vertex AI est la bonne référence.

La tarification de niveau aperçu ne devrait pas servir de base à une modélisation de coût à long terme. La structure tarifaire à la disponibilité générale peut différer des tarifs de niveau aperçu.

Les limites de débit et la stabilité du comportement sont les principales considérations opérationnelles pendant l'aperçu. La planification de la migration vers la production devrait tenir compte de la possibilité de changements de comportement avant la disponibilité générale.

Le choisir

Tournez-vous vers Gemini 3 Pro Preview lorsque :

  • Vous explorez les capacités haut de gamme de nouvelle génération en vue d'un futur déploiement en production.
  • La charge de travail était contrainte par 2.5 Pro sur la profondeur de raisonnement ou la synthèse en contexte long.
  • Vous avez validé contre ce snapshot précis et la migration vers 3.1 Pro Preview n'est pas encore justifiée.
  • Les limites de débit et les considérations de comportement de niveau aperçu sont acceptables.

Choisissez autre chose lorsque :

  • Vous avez besoin d'un comportement stable en production aujourd'hui. Utilisez 2.5 Pro.
  • Vous voulez les raffinements d'aperçu les plus récents. Passez à 3.1 Pro Preview.
  • La charge de travail serait correctement servie par une variante Flash. Descendez d'un cran pour le coût.
  • Vous avez besoin d'une cohérence de refus correspondant au style Anthropic Opus.
  • Le travail est nativement audio, nativement voix ou nativement vidéo.

En résumé. Aperçu Pro de nouvelle génération solide qui progresse significativement par rapport au 2.5 Pro. Pour l'exploration de niveau aperçu et la conception prospective, le 3.1 Pro Preview est généralement le choix le plus actuel. Pour les charges de travail validées contre ce snapshot 3 Pro Preview, il reste pertinent. Pour un déploiement stable en production aujourd'hui, 2.5 Pro est le choix conservateur.

Faites-le tourner contre des alternatives sur vos propres prompts à /live-test.

Dernière revue technique : 2026-05-22 — Tokonomix.ai

Gemini 3 Pro Preview — illustration 2Gemini 3 Pro Preview — illustration 3
Dernier test automatisé
27 mai 2026 · 21:59 UTC · Benchmark
Latence P50
Latence P95
Erreurs
1 / 6 exécutions
Dernière revue par Équipe Tokonomix·26 mai 2026