Aller au contenu
Tier C — Spécialiste
Fonctionne en :USCréé en :United States
Google Gemini

Gemini 3 Flash Preview

Tier C — Spécialiste · 1.048576M tokens

Équipe éditoriale Tokonomix·Relu par Mes Kalkan··

Gemini 3 Flash Preview est un grand modèle de langage développé par Google dans le cadre de la famille de modèles Gemini. Il est conçu pour les tâches standard de génération de texte, offrant aux développeurs et aux chercheurs un accès à des capacités avancées de traitement du langage naturel. Cette version preview fournit un accès anticipé aux caractéristiques et aux performances de la variante Flash avant sa disponibilité générale. Le modèle dispose d'une fenêtre de contexte étendue de 1 048 576 tokens (1M tokens), lui permettant de traiter et de maintenir la cohérence sur des documents très longs, des conversations prolongées ou des bases de code volumineuses. Cette capacité contextuelle substantielle le rend particulièrement adapté aux applications nécessitant l'analyse de documents volumineux, aux dialogues complexes multi-tours, ou aux tâches qui bénéficient de l'accès à des informations de référence étendues au sein d'un même prompt. Au sein de la gamme Gemini de Google, la variante Flash se positionne comme une option optimisée pour la performance, qui équilibre capacité et efficacité. Tout en conservant de solides aptitudes en compréhension et en génération de langage, les modèles Flash sont conçus pour offrir des temps de réponse plus rapides que leurs homologues Ultra, ce qui les rend appropriés aux applications où la latence est un critère. La mention preview indique qu'il s'agit d'une version pré-publication permettant aux utilisateurs d'évaluer les capacités du modèle et de fournir des retours durant son cycle de développement. Les capacités standard de génération de texte incluent des tâches telles que la synthèse, la réponse aux questions, la création de contenu, la génération de code et les interactions conversationnelles.

Gemini 3 Flash Preview offre un accès anticipé aux capacités de la prochaine génération Flash avec une fenêtre d un million de tokens.

Synthèse benchmark Tokonomix
Section 01

Analyse de vitesse

Latence mesurée sur toutes les exécutions de benchmark. P50 (médiane) et P95 (95e percentile) donnent une image réaliste de la vitesse de réponse en charge normale et de pointe.

Latence P50 (médiane)Latence P9514 runs
5337429501159136705-2705-31ms
Section 02

Scores de qualité

Résultats d'évaluation issus des notations du modèle juge sur diverses catégories de tâches. Les scores reflètent la cohérence, la précision et le suivi des instructions.

87
Génération de code
98
Multilingue
98
Raisonnement
Section 03

Historique des tarifs

Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.

💰
Tarifs API — Gemini 3 Flash Preview
$0.5000 par 1M de tokens d'entrée
$3.00 par 1M de tokens de sortie
≈ $0.0009 par conversation typique (800 tokens)
Prix entrée vs sortie (par 1M de tokens)
par 1M de tokens d'entrée$0.5000
par 1M de tokens de sortie$3.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.5000

input / 1M

— stable

$3.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Section 04

Tokens par seconde

Débit en tokens par seconde, dérivé de la latence P50 mesurée. Plus haut est mieux ; les fluctuations reflètent la charge côté fournisseur.

Débit (tokens / s)337 / avg 246
371156

Estimé à partir de la latence P50 × 200 tokens de sortie — le chiffre absolu dépend de cette hypothèse ; c'est la tendance qui compte.

Section 05

Forces & faiblesses

Basé sur les résultats de benchmarks et les retours communautaires agrégés sur des cas d'usage réels.

Forces

Accès anticipé gen 3Contexte d un million de tokensArchitecture optimisée pour la vitesseCapacités de génération avancéesPerformances améliorées vs gen 2

Faiblesses

Statut preview, instabilité possibleFonctionnalités susceptibles de changerPas recommandé pour production critiqueDocumentation encore limitée
Section 06

Capacités

toolssource: litellmvisionjson modepdf inputreasoningjson schemaparallel toolsprompt cachingoutputTokenLimit: 65536max output tokens: 65535
Section 07

Questions fréquentes

Le statut Preview indique un accès anticipé avant la sortie officielle, avec des fonctionnalités susceptibles d évoluer ou de changer.

Un aperçu prometteur de la génération suivante, pour les développeurs prêts à explorer les fonctionnalités en avant-première.

Synthèse benchmark Tokonomix
Section 08

Disponibilité

Disponibilité

Pas encore de données

Nous n'avons pas encore enregistré suffisamment d'appels API pour afficher les statistiques de disponibilité de ce modèle. Les données apparaîtront dès que le modèle reçoit du trafic en direct.

Section 09

Verdicts benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-576/100 · 74 runs
50 correct12 partial12 wrong68% accuracy
2026-06-14

Major capability expansion with tools, vision, and reasoning support added

Gemini 3 Flash Preview has undergone a significant transformation with the addition of eight new capabilities including tools, vision, JSON mode, PDF input, reasoning, JSON schema, parallel tools, and prompt caching. This represents a fundamental expansion from a text-only model to a multimodal platform with extensive integration options. The addition of tool calling and parallel tool execution enables sophisticated agent workflows, while vision and PDF input support broaden the range of input types the model can process. JSON schema support and JSON mode provide structured output capabilities essential for application integration. The reasoning capability suggests enhanced analytical performance, though benchmark scores are not available in the current window to quantify improvements. Prompt caching should improve efficiency for repetitive tasks. These additions position the model as a comprehensive solution for developers building complex applications that require multiple modalities and integration patterns. Users should note that while the capability set has dramatically expanded, performance metrics for the new benchmark window are pending, making it difficult to assess quality relative to the previous window where scores showed balanced improvements across categories.

Quality

Latency p50

Test runs

0

Eight new capabilities added Tool calling and vision support Multimodal input processing enabled Structured output via JSON schema
Section 10

Profil complet du modèle

Gemini 3 Flash Preview — illustration 1
Gemini 3 Flash Preview : la première préversion du Flash de nouvelle génération

Note — profil prospectif. Gemini 3 Flash Preview (gemini-3-flash-preview) est un instantané de préversion de la génération Flash 3.x. Le comportement, les capacités et les limites de taux évolueront avant la disponibilité générale et ont vraisemblablement évolué vers les variants 3.1 Flash.

La première version de préversion du modèle Flash de nouvelle génération de Google. Une fenêtre de contexte de 1 048 576 tokens. Entrée texte-plus-vision. Le modèle qui a ouvert la ligne Flash 3.x avant que les affinements 3.1 n'arrivent.

Le positionnement de cet instantané dans la famille est spécifique. Ce n'est pas le choix stable en production — c'est 2.5 Flash. Ce n'est pas non plus la préversion la plus récente — elle a évolué vers les variants 3.1 Flash. Pour la plupart des charges de travail, l'un de ces deux est le meilleur point de départ. Cette préversion reste utile pour les équipes qui ont épinglé la 3 Flash Preview tôt dans son cycle de vie et ne sont pas encore prêtes à migrer.

Où cet instantané s'inscrit aujourd'hui

Quelques situations où l'instantané 3 Flash Preview reste le bon choix :

  • Les évaluations épinglées et les benchmarks spécifiques à la 3 Flash Preview, où une comparaison stable sur le cycle de vie de l'instantané compte.
  • Les déploiements de niveau préversion existants validés contre cette version et n'ayant pas encore justifié la migration vers les variants 3.1 Flash.
  • La recherche qui compare explicitement l'évolution du Flash 3.x et a besoin de la première préversion comme point de référence.

Si aucun de ceux-là ne s'applique, les meilleurs points de départ actuels sont 2.5 Flash pour un comportement stable en production ou l'un des variants 3.1 Flash pour les travaux de préversion de nouvelle génération.

Ce qu'il fait bien

Les points forts de la génération 3.x apparaissent ici dans leur première forme :

  • Un raisonnement plus acéré que la génération 2.5 Flash sur les tâches multi-étapes.
  • Une meilleure qualité d'attention long-contexte en profondeur — la fenêtre 1M se tient mieux au-delà de 200 000 tokens que 2.5 Flash.
  • Une meilleure adhérence aux sorties structurées sur les schémas complexes.
  • Une meilleure qualité vision sur les tâches standard de lecture de documents.
  • Une posture de refus plus alignée avec les grands modèles Gemini.

Les améliorations par rapport à 2.5 Flash sont réelles mais les variants 3.1 Flash les ont affinées davantage. Pour les charges de travail qui n'ont pas encore validé un instantané 3.x Flash, les variants 3.1 sont le choix le plus actuel.

Ce qu'il fait mal

Les considérations de niveau préversion s'appliquent. Les limites de taux, la disponibilité régionale et les comportements spécifiques peuvent changer avant la disponibilité générale.

Cet instantané représente la première préversion de la génération Flash 3.x. Les variants 3.1 corrigent les aspérités que cette version a encore. Pour les charges de travail où ces affinements comptent, la migration vers un variant 3.1 est le meilleur chemin.

La latence en profondeur dans la fenêtre de contexte est réelle, comme pour tout modèle avec une fenêtre 1M. Pour les applications sensibles au temps, des modèles plus petits avec des stratégies de caching peuvent mieux convenir.

Positionnement face à la concurrence

Face à 2.5 Flash. La 3 Flash Preview offre des améliorations sur le raisonnement et l'attention long-contexte au prix d'un comportement de niveau préversion. Pour les déploiements stables en production, 2.5 Flash reste le bon choix. Pour l'exploration en préversion, les préversions 3.x sont la bonne famille.

Face aux variants 3.1 Flash. La génération 3.1 affine ce que la 3 Flash Preview a introduit. Pour les nouveaux projets dans la famille 3.x, les variants 3.1 sont le point de départ le plus actuel. La migration de 3 Flash Preview vers un variant 3.1 Flash est un petit saut comparé à la migration depuis 2.5 Flash.

Le tableau par catégorie est sur /benchmarks/leaderboard et les scores par catégorie sur /benchmarks/intelligence.

Chemins de migration

Les chemins directs depuis 3 Flash Preview :

  • Pour un comportement de préversion plus actuel avec des capacités similaires, l'un des variants 3.1 Flash est la cible naturelle. Le comportement est suffisamment proche pour que le travail de validation soit typiquement modeste.
  • Pour un déploiement stable en production, 2.5 Flash est la cible conservatrice.
  • Pour les charges de travail qui ont dépassé le niveau Flash entièrement, 2.5 Pro ou 3.1 Pro Preview couvrent le passage à la version supérieure.

Quand l'adopter

Choisissez Gemini 3 Flash Preview quand :

  • Vous avez un déploiement de niveau préversion existant validé contre cet instantané spécifique.
  • Vous avez besoin d'un instantané épinglé pour des raisons de recherche ou de comparaison.
  • Une migration vers un variant 3.1 Flash n'est pas encore justifiée.

Choisissez autre chose quand :

  • Vous démarrez depuis zéro en 2026. Utilisez 2.5 Flash ou l'un des variants 3.1 Flash.
  • Vous avez besoin d'un comportement stable en production aujourd'hui. Utilisez 2.5 Flash.
  • La charge de travail nécessite les affinements que la génération 3.1 a apportés.
  • Le travail est audio, voix ou vidéo.

En résumé. La préversion d'ouverture de la génération Flash 3.x. Pour les nouveaux projets, les variants 3.1 ou le Flash 2.5 de production sont généralement le meilleur point de départ. Pour les déploiements existants validés contre cet instantané, il reste un choix raisonnable jusqu'à ce que la migration soit justifiée.

Comparez avec 2.5 Flash et les variants 3.1 Flash sur vos propres prompts à /live-test.

Dernière vérification technique : 2026-05-22 — Tokonomix.ai

Gemini 3 Flash Preview — illustration 2
Dernier test automatisé
14 juin 2026 · 04:58 UTC · Benchmark
Latence P50
2780 ms
Latence P95
Erreurs
0 / 6 exécutions
Dernière revue par Équipe Tokonomix·24 mai 2026