Gemini 3 Flash est-il plus rapide que Gemini 2.5 Flash ?

En tant que nouvelle génération, il vise des améliorations de performance, bien que les comparaisons exactes dépendent des benchmarks officiels au moment de la sortie.

Peut-on utiliser ce modèle en production ?

Avec précaution. Le statut Preview implique que les performances et comportements peuvent varier avant la version stable.

Quelle est la taille de la fenêtre de contexte ?

Gemini 3 Flash Preview dispose d une fenêtre de contexte d un million de tokens, comparable à Gemini 2.5 Flash.

Comment accéder à ce modèle preview ?

Via l API Google AI Platform selon les modalités d accès preview définies par Google pour cette génération.

Tier C — Spécialiste

Fonctionne en :USCréé en :United States

Google Gemini

Gemini 3 Flash Preview

Tier C — Spécialiste · 1.048576M tokens

Équipe éditoriale Tokonomix·Relu par Mes Kalkan·Publié le 22 mai 2026·Dernière relecture 24 mai 2026

Gemini 3 Flash Preview est un grand modèle de langage développé par Google dans le cadre de la famille de modèles Gemini. Il est conçu pour les tâches standard de génération de texte, offrant aux développeurs et aux chercheurs un accès à des capacités avancées de traitement du langage naturel. Cette version preview fournit un accès anticipé aux caractéristiques et aux performances de la variante Flash avant sa disponibilité générale. Le modèle dispose d'une fenêtre de contexte étendue de 1 048 576 tokens (1M tokens), lui permettant de traiter et de maintenir la cohérence sur des documents très longs, des conversations prolongées ou des bases de code volumineuses. Cette capacité contextuelle substantielle le rend particulièrement adapté aux applications nécessitant l'analyse de documents volumineux, aux dialogues complexes multi-tours, ou aux tâches qui bénéficient de l'accès à des informations de référence étendues au sein d'un même prompt. Au sein de la gamme Gemini de Google, la variante Flash se positionne comme une option optimisée pour la performance, qui équilibre capacité et efficacité. Tout en conservant de solides aptitudes en compréhension et en génération de langage, les modèles Flash sont conçus pour offrir des temps de réponse plus rapides que leurs homologues Ultra, ce qui les rend appropriés aux applications où la latence est un critère. La mention preview indique qu'il s'agit d'une version pré-publication permettant aux utilisateurs d'évaluer les capacités du modèle et de fournir des retours durant son cycle de développement. Les capacités standard de génération de texte incluent des tâches telles que la synthèse, la réponse aux questions, la création de contenu, la génération de code et les interactions conversationnelles.

Gemini 3 Flash Preview offre un accès anticipé aux capacités de la prochaine génération Flash avec une fenêtre d un million de tokens.
— Synthèse benchmark Tokonomix

Section 01

Scores de qualité

Résultats d'évaluation issus des notations du modèle juge sur diverses catégories de tâches. Les scores reflètent la cohérence, la précision et le suivi des instructions.

Créatif

Factuel

100

Multilingue

Raisonnement

Section 02

Historique des tarifs

Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.

💰

Tarifs API — Gemini 3 Flash Preview

$0.5000 par 1M de tokens d'entrée

$3.00 par 1M de tokens de sortie

≈ $0.0009 par conversation typique (800 tokens)

Prix entrée vs sortie (par 1M de tokens)

par 1M de tokens d'entrée$0.5000

par 1M de tokens de sortie$3.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.5000

input / 1M

— stable

$3.00

output / 1M

— stable

2026-05-242026-07-052026-07-26

Input

Output

Price change

⟳ synced weekly

Section 03

Forces & faiblesses

Basé sur les résultats de benchmarks et les retours communautaires agrégés sur des cas d'usage réels.

Forces

Accès anticipé gen 3Contexte d un million de tokensArchitecture optimisée pour la vitesseCapacités de génération avancéesPerformances améliorées vs gen 2

Faiblesses

Statut preview, instabilité possibleFonctionnalités susceptibles de changerPas recommandé pour production critiqueDocumentation encore limitée

Section 04

Capacités

toolssource: litellmvisionjson modepdf inputreasoningjson schemaparallel toolsprompt cachingoutputTokenLimit: 65536max output tokens: 65535

Section 05

Questions fréquentes

Le statut Preview indique un accès anticipé avant la sortie officielle, avec des fonctionnalités susceptibles d évoluer ou de changer.

Un aperçu prometteur de la génération suivante, pour les développeurs prêts à explorer les fonctionnalités en avant-première.
— Synthèse benchmark Tokonomix

Section 06

Disponibilité

Pas encore de données

Nous n'avons pas encore enregistré suffisamment d'appels API pour afficher les statistiques de disponibilité de ce modèle. Les données apparaîtront dès que le modèle reçoit du trafic en direct.

Section 07

Verdicts benchmark Tokonomix

⚖️

Endorsed by 2 judges

Independent LLM judges evaluated this model on our weekly intelligence tests

cohere/command-a100/100 · 1 runs

1 correct0 partial0 wrong100% accuracy

claude-sonnet-4-578/100 · 114 runs

79 correct17 partial18 wrong69% accuracy

● 2026-07-26

Severe quality regression with factual and reasoning capabilities degraded

Gemini 3 Flash Preview has experienced a dramatic quality decline, dropping from 99.1 to 48.5 overall score. The most concerning development is a complete failure in factual tasks, scoring 0 compared to the previous window's strong performance. Reasoning capabilities have also collapsed to just 5 points. While creative performance remains exceptional at 89 and multilingual support stays perfect at 100, these strengths cannot offset the critical losses in core capabilities. The coding category, which previously scored 99, was not tested in the current window, leaving questions about whether these capabilities remain intact. Latency has marginally improved from 4139ms to 4024ms, but this minor performance gain is overshadowed by the quality regression. This appears to be a significant deployment issue or model update that has fundamentally broken factual accuracy and logical reasoning. Users relying on this model for information retrieval, analysis, or any task requiring factual correctness should exercise extreme caution or consider alternatives until these issues are resolved. The stark contrast between category scores suggests possible data pipeline or model configuration problems rather than intentional changes.

Quality

48.5

Latency p50

4,024 ms

Test runs

✗ Factual capability completely broken✗ Reasoning dropped to 5✓ Creative performance remains strong✓ Multilingual support still perfect

Section 08

Profil complet du modèle

Gemini 3 Flash Preview : la première préversion du Flash de nouvelle génération

Note — profil prospectif. Gemini 3 Flash Preview (gemini-3-flash-preview) est un instantané de préversion de la génération Flash 3.x. Le comportement, les capacités et les limites de taux évolueront avant la disponibilité générale et ont vraisemblablement évolué vers les variants 3.1 Flash.

La première version de préversion du modèle Flash de nouvelle génération de Google. Une fenêtre de contexte de 1 048 576 tokens. Entrée texte-plus-vision. Le modèle qui a ouvert la ligne Flash 3.x avant que les affinements 3.1 n'arrivent.

Le positionnement de cet instantané dans la famille est spécifique. Ce n'est pas le choix stable en production — c'est 2.5 Flash. Ce n'est pas non plus la préversion la plus récente — elle a évolué vers les variants 3.1 Flash. Pour la plupart des charges de travail, l'un de ces deux est le meilleur point de départ. Cette préversion reste utile pour les équipes qui ont épinglé la 3 Flash Preview tôt dans son cycle de vie et ne sont pas encore prêtes à migrer.

Où cet instantané s'inscrit aujourd'hui

Quelques situations où l'instantané 3 Flash Preview reste le bon choix :

Les évaluations épinglées et les benchmarks spécifiques à la 3 Flash Preview, où une comparaison stable sur le cycle de vie de l'instantané compte.
Les déploiements de niveau préversion existants validés contre cette version et n'ayant pas encore justifié la migration vers les variants 3.1 Flash.
La recherche qui compare explicitement l'évolution du Flash 3.x et a besoin de la première préversion comme point de référence.

Si aucun de ceux-là ne s'applique, les meilleurs points de départ actuels sont 2.5 Flash pour un comportement stable en production ou l'un des variants 3.1 Flash pour les travaux de préversion de nouvelle génération.

Ce qu'il fait bien

Les points forts de la génération 3.x apparaissent ici dans leur première forme :

Un raisonnement plus acéré que la génération 2.5 Flash sur les tâches multi-étapes.
Une meilleure qualité d'attention long-contexte en profondeur — la fenêtre 1M se tient mieux au-delà de 200 000 tokens que 2.5 Flash.
Une meilleure adhérence aux sorties structurées sur les schémas complexes.
Une meilleure qualité vision sur les tâches standard de lecture de documents.
Une posture de refus plus alignée avec les grands modèles Gemini.

Les améliorations par rapport à 2.5 Flash sont réelles mais les variants 3.1 Flash les ont affinées davantage. Pour les charges de travail qui n'ont pas encore validé un instantané 3.x Flash, les variants 3.1 sont le choix le plus actuel.

Ce qu'il fait mal

Les considérations de niveau préversion s'appliquent. Les limites de taux, la disponibilité régionale et les comportements spécifiques peuvent changer avant la disponibilité générale.

Cet instantané représente la première préversion de la génération Flash 3.x. Les variants 3.1 corrigent les aspérités que cette version a encore. Pour les charges de travail où ces affinements comptent, la migration vers un variant 3.1 est le meilleur chemin.

La latence en profondeur dans la fenêtre de contexte est réelle, comme pour tout modèle avec une fenêtre 1M. Pour les applications sensibles au temps, des modèles plus petits avec des stratégies de caching peuvent mieux convenir.

Positionnement face à la concurrence

Face à 2.5 Flash. La 3 Flash Preview offre des améliorations sur le raisonnement et l'attention long-contexte au prix d'un comportement de niveau préversion. Pour les déploiements stables en production, 2.5 Flash reste le bon choix. Pour l'exploration en préversion, les préversions 3.x sont la bonne famille.

Face aux variants 3.1 Flash. La génération 3.1 affine ce que la 3 Flash Preview a introduit. Pour les nouveaux projets dans la famille 3.x, les variants 3.1 sont le point de départ le plus actuel. La migration de 3 Flash Preview vers un variant 3.1 Flash est un petit saut comparé à la migration depuis 2.5 Flash.

Le tableau par catégorie est sur /benchmarks/leaderboard et les scores par catégorie sur /benchmarks/intelligence.

Chemins de migration

Les chemins directs depuis 3 Flash Preview :

Pour un comportement de préversion plus actuel avec des capacités similaires, l'un des variants 3.1 Flash est la cible naturelle. Le comportement est suffisamment proche pour que le travail de validation soit typiquement modeste.
Pour un déploiement stable en production, 2.5 Flash est la cible conservatrice.
Pour les charges de travail qui ont dépassé le niveau Flash entièrement, 2.5 Pro ou 3.1 Pro Preview couvrent le passage à la version supérieure.

Quand l'adopter

Choisissez Gemini 3 Flash Preview quand :

Vous avez un déploiement de niveau préversion existant validé contre cet instantané spécifique.
Vous avez besoin d'un instantané épinglé pour des raisons de recherche ou de comparaison.
Une migration vers un variant 3.1 Flash n'est pas encore justifiée.

Choisissez autre chose quand :

Vous démarrez depuis zéro en 2026. Utilisez 2.5 Flash ou l'un des variants 3.1 Flash.
Vous avez besoin d'un comportement stable en production aujourd'hui. Utilisez 2.5 Flash.
La charge de travail nécessite les affinements que la génération 3.1 a apportés.
Le travail est audio, voix ou vidéo.

En résumé. La préversion d'ouverture de la génération Flash 3.x. Pour les nouveaux projets, les variants 3.1 ou le Flash 2.5 de production sont généralement le meilleur point de départ. Pour les déploiements existants validés contre cet instantané, il reste un choix raisonnable jusqu'à ce que la migration soit justifiée.

Comparez avec 2.5 Flash et les variants 3.1 Flash sur vos propres prompts à /live-test.

Dernière vérification technique : 2026-05-22 — Tokonomix.ai

Dernier test automatisé

26 juil. 2026 · 05:30 UTC · Benchmark

Latence P50

2946 ms

Latence P95

—

Erreurs

0 / 6 exécutions

Dernière revue par Équipe Tokonomix·24 mai 2026