İçeriğe geç
Çalıştığı yer:USYapıldığı yer:United States
Google Gemini

Gemini 3.1 Flash Lite

1.048576M token

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··
Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme13 runs
35451367283098905-2805-31ms
Bölüm 02

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

99
Kod üretimi
98
Yaratıcı
100
Olgusal
100
Çok dilli
Bölüm 03

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — Gemini 3.1 Flash Lite
$0.2500 1M giriş token başına
$1.50 1M çıkış token başına
≈ $0.0004 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$0.2500
1M çıkış token başına$1.50

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.2500

input / 1M

— no change

$1.50

output / 1M

— no change

2026-06-072026-06-072026-06-07
Input
Output
Price change
⟳ synced weekly
Bölüm 04

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)425 / avg 444
559323

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 05

Yetenekler

toolssource: litellmvisionjson modepdf inputreasoningaudio inputjson schemaparallel toolsprompt cachingoutputTokenLimit: 65536max output tokens: 65536
Bölüm 06

Tokonomix kıyaslama kararları

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-598/100 · 7 runs
7 correct0 partial0 wrong100% accuracy
2026-06-07

Gemini 3.1 Flash Lite adds capabilities but shows no performance data

Gemini 3.1 Flash Lite has undergone a significant expansion of capabilities since the previous benchmark window. The model now supports a comprehensive suite of features including tool use, vision processing, JSON mode and schema support, PDF input handling, reasoning capabilities, audio input, parallel tools execution, and prompt caching. This represents a substantial evolution from its previous baseline state, transforming it from a simple text model into a multimodal platform with advanced functionality. However, the current benchmark window contains no performance metrics across any evaluation categories, making it impossible to assess how these new capabilities translate into actual performance. Users should note that while the feature set has expanded dramatically and pricing information has been updated, there is currently no empirical data to validate the model's effectiveness at tasks involving these new modalities. The addition of prompt caching and parallel tools suggests optimization for production use cases, but without benchmark results, the practical impact remains unverified. Organizations considering this model should await performance data before making deployment decisions based solely on the expanded capability list.

Quality

Latency p50

Test runs

0

Multimodal capabilities added Tool use now supported No benchmark data available
Son otomatik test
7 Haz 2026 · 05:03 UTC · Test
P50 gecikme
1910 ms
P95 gecikme
Hatalar
0 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·7 Haziran 2026