Zum Inhalt
Läuft in:USErstellt in:United States
Google Gemini

Gemini 3.1 Flash Lite

1.048576M Tokens

Tokonomix-Redaktionsteam·Geprüft von Mes Kalkan··
Abschnitt 01

Geschwindigkeitsanalyse

Latenz über alle Benchmark-Läufe gemessen. P50 (Median) und P95 (95. Perzentil) zeigen ein realistisches Bild der Antwortgeschwindigkeit bei normaler und Spitzenlast.

P50-Latenz (Median)P95-Latenz13 runs
35451367283098905-2805-31ms
Abschnitt 02

Qualitätswerte

Auswertungsergebnisse aus Judge-Model-Bewertungen über verschiedene Aufgabenkategorien. Werte spiegeln Kohärenz, Genauigkeit und Anweisungsbefolgung wider.

99
Codegenerierung
98
Kreativ
100
Faktisch
100
Mehrsprachig
Abschnitt 03

Preisverlauf

Direkte Provider-Tarife pro Million Tokens, plus eine typische Gesprächskostenschätzung.

💰
API-Tarife — Gemini 3.1 Flash Lite
$0.2500 pro 1M Input-Tokens
$1.50 pro 1M Output-Tokens
≈ $0.0004 pro typischem Gespräch (800 Tokens)
Input- vs. Output-Preis (pro 1M Tokens)
pro 1M Input-Tokens$0.2500
pro 1M Output-Tokens$1.50

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.2500

input / 1M

— no change

$1.50

output / 1M

— no change

2026-06-072026-06-072026-06-07
Input
Output
Price change
⟳ synced weekly
Abschnitt 04

Tokens pro Sekunde

Durchsatz in Tokens pro Sekunde, abgeleitet aus gemessener P50-Latenz. Höhere Werte sind besser; Schwankungen spiegeln die Provider-seitige Last wider.

Durchsatz (Tokens / s)425 / avg 444
559323

Geschätzt aus P50-Latenz × 200 Output-Tokens — die absolute Zahl hängt von dieser Annahme ab; entscheidend ist der Trend.

Abschnitt 05

Fähigkeiten

toolssource: litellmvisionjson modepdf inputreasoningaudio inputjson schemaparallel toolsprompt cachingoutputTokenLimit: 65536max output tokens: 65536
Abschnitt 06

Tokonomix-Benchmark-Urteile

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-598/100 · 7 runs
7 correct0 partial0 wrong100% accuracy
2026-06-07

Gemini 3.1 Flash Lite adds capabilities but shows no performance data

Gemini 3.1 Flash Lite has undergone a significant expansion of capabilities since the previous benchmark window. The model now supports a comprehensive suite of features including tool use, vision processing, JSON mode and schema support, PDF input handling, reasoning capabilities, audio input, parallel tools execution, and prompt caching. This represents a substantial evolution from its previous baseline state, transforming it from a simple text model into a multimodal platform with advanced functionality. However, the current benchmark window contains no performance metrics across any evaluation categories, making it impossible to assess how these new capabilities translate into actual performance. Users should note that while the feature set has expanded dramatically and pricing information has been updated, there is currently no empirical data to validate the model's effectiveness at tasks involving these new modalities. The addition of prompt caching and parallel tools suggests optimization for production use cases, but without benchmark results, the practical impact remains unverified. Organizations considering this model should await performance data before making deployment decisions based solely on the expanded capability list.

Quality

Latency p50

Test runs

0

Multimodal capabilities added Tool use now supported No benchmark data available
Letzter automatisierter Test
7. Juni 2026 · 05:03 UTC · Benchmark
P50-Latenz
1910 ms
P95-Latenz
Fehler
0 / 6 Läufe
Zuletzt geprüft von Tokonomix-Team·7. Juni 2026