Aller au contenu
Fonctionne en :USCréé en :United States
Google Gemini

Gemini 3.1 Flash Lite

1.048576M tokens

Équipe éditoriale Tokonomix·Relu par Mes Kalkan··
Section 01

Analyse de vitesse

Latence mesurée sur toutes les exécutions de benchmark. P50 (médiane) et P95 (95e percentile) donnent une image réaliste de la vitesse de réponse en charge normale et de pointe.

Latence P50 (médiane)Latence P9513 runs
35451367283098905-2805-31ms
Section 02

Scores de qualité

Résultats d'évaluation issus des notations du modèle juge sur diverses catégories de tâches. Les scores reflètent la cohérence, la précision et le suivi des instructions.

99
Génération de code
98
Créatif
100
Factuel
100
Multilingue
Section 03

Historique des tarifs

Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.

💰
Tarifs API — Gemini 3.1 Flash Lite
$0.2500 par 1M de tokens d'entrée
$1.50 par 1M de tokens de sortie
≈ $0.0004 par conversation typique (800 tokens)
Prix entrée vs sortie (par 1M de tokens)
par 1M de tokens d'entrée$0.2500
par 1M de tokens de sortie$1.50

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.2500

input / 1M

— no change

$1.50

output / 1M

— no change

2026-06-072026-06-072026-06-07
Input
Output
Price change
⟳ synced weekly
Section 04

Tokens par seconde

Débit en tokens par seconde, dérivé de la latence P50 mesurée. Plus haut est mieux ; les fluctuations reflètent la charge côté fournisseur.

Débit (tokens / s)425 / avg 444
559323

Estimé à partir de la latence P50 × 200 tokens de sortie — le chiffre absolu dépend de cette hypothèse ; c'est la tendance qui compte.

Section 05

Capacités

toolssource: litellmvisionjson modepdf inputreasoningaudio inputjson schemaparallel toolsprompt cachingoutputTokenLimit: 65536max output tokens: 65536
Section 06

Verdicts benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-598/100 · 7 runs
7 correct0 partial0 wrong100% accuracy
2026-06-07

Gemini 3.1 Flash Lite adds capabilities but shows no performance data

Gemini 3.1 Flash Lite has undergone a significant expansion of capabilities since the previous benchmark window. The model now supports a comprehensive suite of features including tool use, vision processing, JSON mode and schema support, PDF input handling, reasoning capabilities, audio input, parallel tools execution, and prompt caching. This represents a substantial evolution from its previous baseline state, transforming it from a simple text model into a multimodal platform with advanced functionality. However, the current benchmark window contains no performance metrics across any evaluation categories, making it impossible to assess how these new capabilities translate into actual performance. Users should note that while the feature set has expanded dramatically and pricing information has been updated, there is currently no empirical data to validate the model's effectiveness at tasks involving these new modalities. The addition of prompt caching and parallel tools suggests optimization for production use cases, but without benchmark results, the practical impact remains unverified. Organizations considering this model should await performance data before making deployment decisions based solely on the expanded capability list.

Quality

Latency p50

Test runs

0

Multimodal capabilities added Tool use now supported No benchmark data available
Dernier test automatisé
7 juin 2026 · 05:03 UTC · Benchmark
Latence P50
1910 ms
Latence P95
Erreurs
0 / 6 exécutions
Dernière revue par Équipe Tokonomix·7 juin 2026