1 milyon token bağlam penceresi gerçekte ne anlama geliyor?

Yaklaşık 750.000 kelime veya ortalama 1.500 sayfalık metin işleyebilir. Uzun belgeler, kapsamlı sohbet geçmişleri veya geniş kod tabanları için yeterli kapasite sağlar.

Flash ve Lite isimlendirmesi model performansını nasıl etkiliyor?

Flash düşük gecikme optimizasyonunu, Lite ise standart modellere göre daha hafif mimariyi ifade eder. Bu kombinasyon hız öncelikli, kaynak kısıtlı senaryolar için tasarlanmış bir dengeyi gösterir.

Hangi kullanım senaryoları için en uygun?

Sohbet botları, içerik özetleme, belge analizi, müşteri destek otomasyonu ve hızlı metin üretimi gerektiren uygulamalar için idealdir. Görsel veya ses işleme gerektiren projeler için uygun değildir.

Diğer Gemini modelleriyle karşılaştırıldığında nasıl bir konumda?

Gemini ailesinin en hafif ve hızlı seçeneklerinden biridir. Karmaşık muhakeme veya çok modlu görevler yerine, basit metin işleme görevlerinde maliyet ve hız avantajı sunar.

Seviye C — Uzman

Çalıştığı yer:USYapıldığı yer:United States

Arşivlendi

Bu model sağlayıcı tarafından kullanımdan kaldırıldı. Geçmiş veriler korunmaktadır.

27 Mayıs 2026 tarihinden beri kullanılamıyor.

Google Gemini

Gemini 3.1 Flash Lite Preview

Seviye C — Uzman · 1.048576M token

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan·Yayınlandı 22 Mayıs 2026·Son inceleme 26 Mayıs 2026

Gemini 3.1 Flash Lite Preview, Google tarafından Gemini model ailesinin bir parçası olarak geliştirilen hafif bir metin üretim modelidir. Bu önizleme sürümü, maksimum yetenek yerine hız ve verimliliğin öncelikli olduğu standart metin üretim görevleri için tasarlanmıştır. Serideki daha büyük modellere kıyasla azaltılmış hesaplama yüküyle hızlı yanıt süreleri gerektiren geliştiriciler ve uygulamalar için erişilebilir bir seçenek olarak hizmet eder. Model, 1.048.576 token (1M token) bağlam penceresine sahiptir ve bu sayede önemli miktarda metin girişi boyunca tutarlılığı işleyip koruyabilir. Bu genişletilmiş bağlam kapasitesi, karmaşık belgeleri, uzun konuşmaları ve önemli ölçüde geçmiş bilgi gerektiren görevleri yönetmesine olanak tanır. Gemini 3.1 Flash Lite Preview, çok modlu özellikler olmaksızın temel metin üretim yeteneklerine odaklanır ve bu da onu içerik taslağı oluşturma, konuşma arayüzleri, özetleme ve genel amaçlı doğal dil işleme görevleri gibi uygulamalar için uygun hale getirir. Google'ın Gemini ekosisteminde bu model, kaynak kısıtlamalarının önemli olduğu uygulamalar için optimize edilmiş bir konumda yer alır. "Flash" tanımı düşük gecikme için optimizasyonu, "Lite" ise standart Gemini varyantlarına kıyasla sadeleştirilmiş bir mimariyi ifade eder. Bir önizleme sürümü olarak, geliştiricilere Google'ın gelişen hafif model mimarisine erken erişim sunar; ancak özellikler ve performans karakteristikleri, model genel kullanıma doğru ilerledikçe değişebilir. Bu model, farklı kullanım senaryosu gereksinimlerini karşılamak amacıyla Gemini ailesi içinde çeşitli performans katmanları sunma yaklaşımını temsil etmektedir.

Gemini 3.1 Flash Lite Preview, Google'ın hız odaklı hafif model ailesinin en yalın temsilcisi olarak, 1 milyon token bağlam penceresiyle kaynak verimliliği arayan geliştiricilere erken erişim sunuyor.
— Tokonomix model analiz özeti

Bölüm 01

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰

API tarifeleri — Gemini 3.1 Flash Lite Preview

$0.2500 1M giriş token başına

$1.50 1M çıkış token başına

≈ $0.0004 tipik konuşma başına (800 token)

Giriş vs çıkış fiyatı (1M token başına)

1M giriş token başına$0.2500

1M çıkış token başına$1.50

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.2500

input / 1M

— no change

$1.50

output / 1M

— no change

2026-05-242026-05-242026-05-24

Input

Output

Price change

⟳ synced weekly

Bölüm 02

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

Optimize edilmiş düşük gecikme süresi1M token bağlam penceresiHafif mimari ile kaynak tasarrufuUzun sohbet geçmişi desteğiKapsamlı doküman işleme kapasitesiHızlı yanıt gerektiren uygulamalar için idealTemel metin üretiminde verimliGemini ekosistemine erken erişim

Zayıf yönler

Önizleme sürümü kararlılık belirsizliğiÇok modlu özellik eksikliğiC seviyesi performans sınırlamalarıBelgelenmemiş yetenek detayları

Bölüm 03

Yetenekler

outputTokenLimit: 65536

Bölüm 04

Sık sorulan sorular

Önizleme statüsü nedeniyle model özellikleri ve davranışları değişebilir. Kritik üretim sistemleri için kararlı sürümleri beklemek önerilir, ancak düşük riskli projeler ve testler için uygun olabilir.

Düşük gecikme ve geniş bağlam gerektiren ancak çok modlu yeteneklere ihtiyaç duymayan uygulamalar için mantıklı bir seçim. Önizleme statüsü, üretim ortamlarında dikkatli değerlendirme gerektiriyor.
— Tokonomix editöryal değerlendirme

Bölüm 05

Kullanılabilirlik

Henüz ölçüm verisi yok

Bu model için kullanılabilirlik istatistiklerini göstermek için yeterli API çağrısı henüz kaydedilmedi. Veri, model canlı trafik almaya başlayınca görünür.

Bölüm 06

Tokonomix kıyaslama kararları

⚖️

Endorsed by 1 judge

Independent LLM judges evaluated this model on our weekly intelligence tests

claude-sonnet-4-596/100 · 68 runs

65 correct3 partial0 wrong96% accuracy

● 2026-05-24

Sürekli teknik mükemmellikle kalite artışı ve daha hızlı yanıt süreleri

Gemini 3.1 Flash Lite Preview, bu kıyaslama döneminde temel metriklerde ölçülebilir iyileşmeler sergiliyor. Genel kalite 95.3'ten 96.5'e yükselirken, gecikme süresi %20 iyileşti; p50 değeri 2168ms'den 1741ms'ye düştü. Bu kazanımlar, doğruluktan ödün vermeden kullanıcı deneyimine anlamlı katkılar sunuyor. Teknik yetenekler olağanüstü seviyesini koruyor; muhakeme ve kodlamada her iki dönemde de tam 100 puan elde edildi. Olgusal doğruluk da benzer şekilde en üst düzeyde kalarak önceki dönemdeki 99'a karşılık mevcut dönemde 100 puana ulaştı. Yaratıcı kategoride 93'ten 87'ye düşüşle bir miktar değişkenlik gözleniyor; yine de bu seviye sağlam bir rekabet gücünü temsil ediyor. Zorg kategorisi 87'den 91'e dikkat çekici bir iyileşme göstererek bu görev türünün daha iyi ele alındığına işaret ediyor. Test çalıştırma sayısının 28'den 11'e düşmesi, mevcut sonuçların daha küçük bir örneklemden geldiği anlamına gelse de teknik skorlardaki tutarlılık istikrarlı bir performansa işaret ediyor. Daha hızlı yanıtlar ile korunan doğruluğun birleşimi, bu sürümü hem hız hem de hassasiyet gerektiren uygulamalar için özellikle güçlü kılıyor. Kullanıcılar, muhakeme ağırlıklı ve kodlama görevlerinde güvenilir performans beklerken belirgin biçimde azalan bekleme sürelerinden de yararlanabilir.

Quality

96.5

Latency p50

1,741 ms

Test runs

✓ %20 daha hızlı yanıt süreleri✓ Kalite puanı 96,5'e yükseldi✓ Zorg performansı arttı✗ Yaratıcılık puanları düştü

Bölüm 07

Tam model profili

Gemini 3.1 Flash Lite Preview: yeni nesil maliyet kademesi

Not — ileriye dönük profil. Gemini 3.1 Flash Lite Preview (gemini-3.1-flash-lite-preview) bir önizleme anlık görüntüsüdür. Davranış, yetenekler ve hız sınırları, genel kullanıma sunulmadan önce değişecektir.

Google'ın Flash ailesindeki yeni nesil maliyet kademesi girişi. 1.048.576 token'lık bir bağlam penceresi. Metin artı görsel girişi. Daha önceki Lite anlık görüntülerini yüksek hacimli işler için uygulanabilir kılan maliyet konumlandırmasını korurken, Lite kademesini akıl yürütme kalitesi ve yapılandırılmış çıktı güvenilirliği açısından ileriye taşımak üzere tasarlandı.

Bu önizlemeye uyan çerçeve. 3.1 Flash Lite, 2.5 Flash-Lite'ın istediğiniz maliyet kademesi olduğu ancak kalitenin gönderebileceklerinizde sınırlayıcı faktör olarak kaldığı durumlarda başvuracağınız modeldir. 3.1 nesli, bu farkın bir kısmını kapatıyor. Bu fark kapatmanın, çalışan bir 2.5 Flash-Lite kurulumundan göçü haklı çıkarmaya yetip yetmeyeceği, sizin spesifik iş yükünüze bağlıdır.

2.5 Flash-Lite'tan değişenler

3.1 Lite nesli, 2.5 Lite anlık görüntüsüne göre birkaç iyileştirme getiriyor:

Çok adımlı görevlerde daha güçlü akıl yürütme. Daha önceki Lite kademeleri basit çıkarım ve sınıflandırmayı temiz şekilde idare ediyordu ancak zincirleme akıl yürütmede zorlanıyordu. 3.1 önizlemesi burada anlamlı bir iyileşme gösteriyor.
Derinlikte daha iyi uzun bağlam dikkati. 2.5 Lite neslinin başardığından daha güvenilir biçimde, 200 binin üzerinde token'lık girdiyi bir arada tutuyor.
Geliştirilmiş yapılandırılmış çıktı tutarlılığı. 2.5 Lite'ın zaman zaman kaydığı karmaşık iç içe geçmiş düzenlerde bile JSON şemaları güvenilir biçimde korunuyor.
Daha tutarlı reddetme duruşu. Sınırda kalan istemler, daha büyük Gemini modelleriyle daha uyumlu bir şekilde ele alınıyor — yanıtlananlar ile reddedilenler arasında daha az tutarsız karar.
Standart belge okuma görevlerinde daha keskin görsel kalitesi. Hâlâ tam Flash varyantı seviyesinde değil ama fark, 2.5 neslindeki kadar büyük değil.

Tek başına hiçbiri çarpıcı değil. Bileşik etki, bir Lite kademesinin yapması gereken işleri daha fazla yapan bir Lite kademesi.

İyi yaptıkları

Manşet birleşimi, 2.5 Lite neslindekiyle aynı kalıyor: Lite kademesi fiyatında bir milyon token'lık bağlam penceresi. 3.1 önizlemesi, daha önceki Lite kademelerinin yetersiz kaldığı sentez tarzı iş yükleri için bu birleşimi daha kullanılabilir hale getiriyor.

Kısa istemlerde gecikme süresi iyi tutunuyor. Flash-Lite markası, akış tepkiselliğinde hakkını veriyor. Düşük maliyetle gerçek zamanlı hissi veren sohbet deneyimleri için gecikme profili gerçekten kullanılabilir.

Multimodal girdi, rutin belge okuma işlerini temiz biçimde idare ediyor. Ekran görüntüleri, taranmış formlar, dashboard yakalamaları — çoğu çıkarım hattı için yeterli.

Araç kullanımı ve yapılandırılmış çıktı, bu kademedeki ajan biçimli iş yükleri için yeterince güvenilir. Şema bağlılığı 2.5 Lite'a göre iyileştirilmiş.

Kötü yaptıkları

Hâlâ bir Lite kademesi. Gerçekten zorlu çok adımlı akıl yürütme için, tam 3.x Flash varyantları veya Pro kademesi doğru yukarı geçiş seçenekleri.

Derinlikte uzun bağlam dikkati, 2.5 Lite neslinden daha iyi ancak dağınık olgular arasında sentez konusunda hâlâ tam Flash varyantlarının gerisinde. Saf erişim tarzı sorgular için Lite kademesi tutunuyor; derinlikte sentez için yukarı çıkın.

Görsel kalitesi iyileştirilmiş ama hâlâ tam Flash varyantının altında. Görsel kalitesinin maliyetten daha önemli olduğu görsel yoğunluklu iş yükleri için bu, yanlış başlangıç noktasıdır.

Önizleme kademesi değerlendirmeleri geçerlidir. Hız sınırları, bölgesel kullanılabilirlik ve belirli davranışlar, genel kullanıma sunulmadan önce değişebilir. Bugün kararlı davranışa ihtiyaç duyan üretim iş yükleri için 2.5 Flash-Lite, daha temkinli seçim olmaya devam ediyor.

Sahaya göre nerede konumlanıyor

Daha önceki Lite anlık görüntülerine karşı — 2.5 Flash-Lite. 3.1 önizlemesi, yeni yapımlar için doğal yükseltmedir. Mevcut kurulumlar için göç gerekçesi, kalite iyileştirmelerinin sizin spesifik iş yükünüz için önemli olup olmadığına ve önizleme kademesi davranışının kabul edilebilir olup olmadığına bağlıdır.

Tam 3.x Flash önizlemelerine karşı. Beklendiği gibi, tam varyantlar her alanda Lite varyantından daha iyi performans gösteriyor. 3.x neslinde Lite ile tam arasındaki seçim, 2.5 neslindekiyle aynı denge olan, spesifik iş yükünüzdeki maliyet-kalite dengesine iniyor.

Aynı banttaki rakiplere karşı. Claude Haiku 4.5, akıl yürütme ağırlıklı iş yüklerinde en güçlü küçük model olmaya devam ediyor ancak 1M bağlam penceresinden yoksun. Daha küçük OpenAI varyantları hızda yarışıyor ancak genellikle daha kısa bağlamla. Uzun bağlamla büyük ölçekte çağrı başına maliyet için, 3.1 Flash Lite Preview genel kullanıma ulaştığında bandında lider olacak şekilde konumlanmış durumda.

Kategori düzeyindeki tablo /benchmarks/leaderboard sayfasında ve kategori başına puanlar /benchmarks/intelligence sayfasında yer alıyor.

Gerçekten faydalı olduğu yerler

3.1 Lite önizlemesinin temiz biçimde uyduğu birkaç iş yükü:

Belirleyici faktörün akıl yürütme derinliği yerine işlem hacmi olduğu, ancak 2.5 Lite'ın akıl yürütmesinin zaman zaman fazla yetersiz kaldığı yüksek hacimli SSS yönlendirme ve sınıflandırma.
Çok adımlı yönlendirme mantığıyla büyük ölçekte müşteri hizmetleri triyajı.
200 binin üzerinde token'da dikkat kalitesinin önemli olduğu, yapılandırılmış belgeler üzerinde uzun bağlamlı erişim.
Çağrı başına maliyetin yeterince düşük olduğu ve deneylemenin bütçe onayı gerektirmediği yeni ajan tasarımlarının prototiplenmesi.
3.1 neslinin yaygın Avrupa dillerini biraz daha iyi terminoloji sadakatiyle idare ettiği çok dilli müşteri desteği.

Yanlış araç olduğu yerler

Bugün kararlı davranışa ihtiyaç duyan üretim iş yükleri. 3.1 önizlemesi genel kullanıma ulaşana kadar 2.5 Flash-Lite'ı kullanın.

Derin çok adımlı akıl yürütme gerektiren herhangi bir şey. Tam 3.x Flash varyantlarına veya bir Pro kademesine yükselin.

Görsel kalitesinin önemli olduğu görsel yoğunluklu iş yükleri. Tam Flash varyantları belirgin biçimde daha iyi çıktı üretir.

Aşağı akış doğrulaması olmaksızın güvenlik açısından kritik uygulamalar. Reddetme duruşu iyileştirilmiş ancak hâlâ daha büyük Gemini modelleri düzeyinde değil.

Gerçek zamanlı ses. Ses girişi yok. /usecases/voice sayfasındaki ses hattı rehberi, doğru mimariyi ele alıyor.

Dağıtım notları

Standart Google Gemini API. REST, akış, araç kullanımı, yapılandırılmış çıktı — hepsi, altta yatan yetenek yüzeyi için beklendiği gibi davranır.

Bölgesel kullanılabilirlik, Google'ın standart Vertex AI desenini izler. AB bölgeleri kurumsal sözleşmelerde mevcuttur. Hazır tüketici API erişimi bir bölgeyi sabitlemez. Katı ikamet kısıtlamaları için Vertex AI bölgesel belgeleri doğru referanstır.

Önizleme kademesi fiyatlandırması, uzun vadeli maliyet modellemesinin temeli olmamalıdır. Genel kullanımdaki fiyatlandırma yapısı, önizleme kademesi oranlarından farklı olabilir. Kapasite varsayımlarınızı buna göre planlayın.

Hız sınırları ve davranış kararlılığı, önizleme sırasındaki ana operasyonel değerlendirmelerdir. Üretim göçleri, genel kullanımdan önce davranış değişikliği olasılığına karşı plan yapmalı ve modelin gelişen çıktılarına karşı aşağı akış sözleşmelerini doğrulamalıdır.

Seçim yapma

Gemini 3.1 Flash Lite Preview'a şu durumlarda başvurun:

Gelecekteki üretim kurulumu için yeni nesil Lite kademesi yeteneklerini keşfediyorsanız.
İş yükü 2.5 Flash-Lite'ın akıl yürütme derinliği tarafından kısıtlandıysa ve 3.1'in farkı kapatıp kapatmadığını görmek istiyorsanız.
Önizleme kademesi hız sınırları, trafik şeklinize uyuyorsa.
Zaten Google yığınındaysanız ve orada kalmak istiyorsanız.

Şu durumlarda başka bir şey seçin:

Bugün üretim açısından kararlı davranışa ihtiyacınız var. 2.5 Flash-Lite'ı kullanın.
İş yükü, bir Lite kademesinin sunabileceğinin ötesinde akıl yürütme derinliği veya görsel kalitesi gerektiriyorsa.
Maliyet kademesi tavizine ve mütevazı akıl yürütmeye ihtiyacınız varsa ve 2.5 Flash-Lite bunu zaten karşılıyorsa. Bu durumda göç, doğrulama çabasına değmeyebilir.
İş ses, konuşma veya video ise.

Özet. 2.5 neslinden anlamlı boşlukları kapatan, umut verici bir yeni nesil Lite kademesi anlık görüntüsü. Önizleme kademesi keşfi ve ileriye dönük tasarım çalışmaları için doğru başlangıç noktasıdır. Bugün üretim açısından kararlı kurulumlar için, 3.1 hattı genel kullanıma ulaşana kadar 2.5 Flash-Lite temkinli seçim olmaya devam ediyor.

2.5 Flash-Lite üzerinden çalıştırdığınız aynı istemlerle /live-test sayfasında deneyin. Farklar en net şekilde doğrudan karşılaştırmada ortaya çıkıyor.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Son otomatik test

27 May 2026 · 21:59 UTC · Test

P50 gecikme

—

P95 gecikme

—

Hatalar

1 / 6 çalıştırma

Son inceleyen Tokonomix Ekibi·26 Mayıs 2026