1 milyon token bağlam penceresi pratikte ne anlama geliyor?

Yaklaşık 700-750 sayfalık metin veya büyük bir kod deposunu tek seferde işleyebilirsiniz. Bu, uzun araştırma makaleleri, kapsamlı teknik dökümanlar veya tüm proje geçmişini içeren konuşmalar için idealdir.

Gemini Pro ile Gemini 3.1 Pro Preview arasındaki fark nedir?

3.1 versiyonu daha yeni nesil bir mimariyi temsil eder ve genellikle geliştirilmiş yeteneklerle birlikte gelir. Preview etiketi, modelin henüz deneysel olduğunu ve genel kullanıma sunulmadan önce test edildiğini gösterir.

Görsel veya ses dosyalarını işleyebilir mi?

Hayır, bu model sadece metin tabanlı girdiler için tasarlanmıştır. Çoklu ortam ihtiyaçlarınız varsa görüntü işleme yeteneklerine sahip diğer Gemini modellerini incelemeniz gerekir.

Hangi kullanım senaryoları için en uygun?

Uzun belge analizi, kapsamlı kod incelemesi, akademik araştırma özetleme, çok turlu teknik danışmanlık ve geniş bağlam gerektiren içerik üretimi için özellikle uygundur. Karmaşık mantıksal çıkarım ve uzun-menzilli bağımlılıklar içeren görevlerde performans gösterir.

Seviye C — Uzman

Çalıştığı yer:USYapıldığı yer:United States

Google Gemini

Gemini 3.1 Pro Preview

Seviye C — Uzman · 1.048576M token

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan·Yayınlandı 22 Mayıs 2026·Son inceleme 26 Mayıs 2026

Gemini 3.1 Pro Preview, Google tarafından Gemini model ailesinin bir parçası olarak geliştirilen büyük bir dil modelidir. Bu model, 3.1 nesline ait deneysel bir önizleme sürümünü temsil etmekte olup Google'ın standart üretim modelleri ile öncü araştırma varyantları arasında konumlanmaktadır. Doğal dil anlama, akıl yürütme, içerik üretimi ve sohbet uygulamaları dahil olmak üzere genel amaçlı metin üretim görevleri için tasarlanmıştır. Modelin en dikkat çekici teknik özelliği, yaklaşık bir milyon token işleme kapasitesine denk gelen 1,048,576 token'lık bağlam penceresidir. Bu genişletilmiş bağlam uzunluğu, modelin tek bir etkileşimde önemli miktarda bilgiyi işleyebilmesini sağlayarak uzun belgeler, kapsamlı kod tabanları veya geniş geçmiş bağlam gerektiren konuşmaları içeren görevler için uygun hale getirmektedir. Model; görüntü işleme veya fonksiyon çağırma gibi çok modlu özellikler sunmaksızın standart metin üretim yetenekleri sağlar. Google'ın model yelpazesi içinde Gemini 3.1 Pro Preview, geliştiricilerin ve araştırmacıların yeni yetenekleri genel kullanıma sunulmadan önce test etmelerine olanak tanıyan bir ara seçenek olarak hizmet vermektedir. Bir önizleme sürümü olarak, kararlı üretim modellerine kıyasla farklı performans özellikleri sergileyebilir ve kullanıcı geri bildirimlerine dayalı değişikliklere veya iyileştirmelere tabi olabilir. Model, metin tabanlı uygulamalar için geniş bağlam pencerelerine ihtiyaç duyan ve önizleme aşamasındaki teknolojiyle çalışmaya istekli kullanıcılara yöneliktir.

Gemini 3.1 Pro Preview, Google'ın bir milyonun üzerinde token işleyebilen deneysel modellerinden biri olarak, uzun belge analizi ve kapsamlı bağlam gerektiren uygulamalar için tasarlanmış bir önizleme sürümü.
— Tokonomix model değerlendirmesi

Bölüm 01

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

Yaratıcı

Olgusal

Çok dilli

Akıl yürütme

Bölüm 02

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰

API tarifeleri — Gemini 3.1 Pro Preview

$2.00 1M giriş token başına

$12.00 1M çıkış token başına

≈ $0.0036 tipik konuşma başına (800 token)

Giriş vs çıkış fiyatı (1M token başına)

1M giriş token başına$2.00

1M çıkış token başına$12.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.00

input / 1M

— stable

$12.00

output / 1M

— stable

2026-05-242026-06-282026-07-26

Input

Output

Price change

⟳ synced weekly

Bölüm 03

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

1 milyon token bağlam penceresiUzun belge işleme kapasitesiYeni özelliklere erken erişimKapsamlı konuşma geçmişi desteğiGelişmiş doğal dil anlamaBüyük kod tabanı analiziGoogle model ailesi entegrasyonuGenel amaçlı metin üretimi

Zayıf yönler

Önizleme aşamasında kararsızlık riskiÇoklu ortam desteği yokFonksiyon çağrısı özelliği eksikC katmanı performans sınırlamaları

Bölüm 04

Yetenekler

toolssource: litellmvisionjson modepdf inputreasoningaudio inputjson schemaprompt cachingoutputTokenLimit: 65536max output tokens: 65536

Bölüm 05

Sık sorulan sorular

Gemini 3.1 Pro Preview bir önizleme sürümü olduğu için kararlı üretim modelleri kadar güvenilir değil. Davranışı geri bildirimlere göre değişebilir. Kritik üretim sistemleri için kararlı Gemini modellerini değerlendirmeniz önerilir.

Kararlı üretim modellerine alternatif arayan ve geniş bağlam penceresiyle deney yapmaya hazır geliştirici ve araştırmacılar için mantıklı bir seçim. Önizleme aşamasında olduğu için risk toleransı yüksek projeler için uygundur.
— Tokonomix editör notu

Bölüm 06

Kullanılabilirlik

Bu modelin çağrıldığında ne sıklıkla yanıt verdiği — son 30 gün içindeki gerçek API istekleri ve canlı testler üzerinden ölçülmüştür. Bu kaliteden bağımsızdır: bu sayılar yalnızca modelin yanıt verip vermediğini gösterir, yanıtın ne kadar iyi olduğunu değil.

Son 7 gün

—

Son 30 gün

100.0%

n=7

Medyan yanıt süresi

9,783ms

n=7

Baz alınan 27 ölçüm son 30 gün içinde.

Teknik detaylar

Yalnızca gerçek API çağrıları ve canlı test istekleri sayılır — dahili yoklamalar ve kıyaslama çalıştırmaları hariçtir.

Özel API anahtarıyla (BYOK) yapılan çağrılar hariçtir: bu hatalar anahtara özgüdür, model kesintisinin işareti değildir.

Başarısız çağrılar kalite puanlarına DAHİL EDİLMEZ — kalite yalnızca başarılı yanıtlar üzerinden ölçülür. Kullanılabilirlik ve kalite bağımsız sinyallerdir.

Kaydedilmiş süreye sahip başarılı çağrılarda medyan yanıt süresi (p50). Aykırı değerler medyanı ortalamadan daha az etkiler.

Toplam çağrı (30d)

OK yanıtlar (30d)

Toplam çağrı (7d)

OK yanıtlar (7d)

Bölüm 07

Tokonomix kıyaslama kararları

⚖️

Endorsed by 2 judges

Independent LLM judges evaluated this model on our weekly intelligence tests

cohere/command-a100/100 · 1 runs

1 correct0 partial0 wrong100% accuracy

claude-sonnet-4-548/100 · 116 runs

43 correct17 partial56 wrong37% accuracy

● 2026-07-26

Gemini 3.1 Pro Preview: Still no benchmark data available

Gemini 3.1 Pro Preview continues to show no benchmark results in this evaluation window, maintaining the same data gap observed previously. The model retains its expanded capability set including tools, vision, JSON mode, PDF input, reasoning, audio input, JSON schema support, and prompt caching. Without performance metrics, it remains impossible to assess how this model compares to other frontier models across key dimensions like reasoning accuracy, coding proficiency, or instruction following. The absence of benchmark data prevents meaningful comparison with competing models from Anthropic, OpenAI, or other providers. Users considering this model should be aware that its actual performance characteristics across standard evaluation tasks remain unquantified. The model's expanded modality support suggests versatility for multimodal applications, but without empirical validation through established benchmarks, claims about capability levels cannot be substantiated. Organizations requiring documented performance profiles for model selection should note this data limitation. Until benchmark results become available, adoption decisions must rely on direct testing rather than comparative performance analysis.

Quality

—

Latency p50

—

Test runs

✗ No benchmark data available

Bölüm 08

Tam model profili

Gemini 3.1 Pro Preview: yeni nesil üst kademe

Not — ileriye dönük profil. Gemini 3.1 Pro Preview (gemini-3.1-pro-preview) bir önizleme anlık görüntüsüdür. Davranış, yetenekler ve oran limitleri, genel kullanılabilirlikten önce değişecektir.

Google'ın Gemini ailesindeki yeni nesil üst kademe giriş. 1.048.576 token'lık bağlam penceresi. Metin artı görsel giriş. Üretim ekiplerinin üzerine inşa ettiği mimari yüzeyi korurken Pro hattını 2.5 Pro nesline kıyasla ileriye taşıyan bir akıl yürütme derinliği.

Bu önizlemeye uyan çerçeveleme. 3.1 Pro, 2.5 Pro'nun güvendiğiniz üretim modeli olduğu ancak kalitenin sınırlayıcı faktör olduğu belirli bir iş yükünüz olduğunda başvuracağınız modeldir. 3.1 nesli bu boşluğun bir kısmını kapatıyor. Bu kapanmanın çalışan bir 2.5 Pro dağıtımından göçü haklı çıkarıp çıkarmadığı, özel durumunuza bağlıdır.

2.5 Pro'dan neler değişti

3.1 Pro nesli, 2.5 Pro'ya kıyasla çeşitli iyileştirmeler getiriyor:

Çok adımlı görevlerde daha keskin akıl yürütme. Düşünce zincirleri derinliğe doğru daha tutarlı kalıyor ve model, karmaşık problemlerde ara kısıtlamaları kaybetme olasılığı daha düşük.
Derinlikte daha iyi uzun bağlam dikkat kalitesi. 1M penceresi 2.5 Pro'da kullanılabilirdi; 3.1 Pro'da 400 bin token'lık girişin ötesinde sentez kalitesi anlamlı ölçüde daha sıkı.
Karmaşık iç içe şemalarda daha iyi yapılandırılmış çıktı uyumu. Araç kullanım çağrı yükleri daha güvenilir.
Yoğun belgelerde ve karmaşık grafiklerde daha güçlü görsel kalite.
Bir yanlış pozitifi hata ayıklayabilmenizi sağlayacak kadar görünür akıl yürütmeye sahip daha tutarlı reddetme duruşu.

Bunların hiçbiri tek başına dönüştürücü değil. Bileşik etki, bir üst kademenin yapması gerekenlerin daha fazlasını yapan bir üst kademedir.

İyi yaptığı şeyler

Manşet kombinasyonu 2.5 Pro ile aynı kalıyor: derinlikte sürdürülen dikkat kalitesine sahip bir milyon token'lık bağlam penceresi. 3.1 nesli her iki boyutu da ileriye taşıyor.

Çok adımlı akıl yürütme en görünür iyileşmedir. 2.5 Pro'nun dikkatli prompt mühendisliği ile üstesinden gelebildiği görevler artık daha basit promptlarla çalışıyor. 2.5 Pro'nun tutarlı bir şekilde başaramadığı görevler artık daha güvenilir çıktı üretiyor.

Görsel kalitesi 2.5 Pro'ya göre iyileşmiş durumda. Belge ekran görüntüleri, taranmış PDF'ler, gösterge paneli görüntüleri, grafikler, diyagramlar — yoğun veya karmaşık kaynaklarda daha özenli ele alınıyor. Tablo çıkarma daha güvenilir. Grafik açıklaması daha doğru büyüklük tahminleri içeriyor.

Araç kullanım güvenilirliği, savunmacı ayrıştırma yazmadan üretim ajan döngüleri oluşturmaya yetecek kadar güçlüdür. 2.5 Pro'ya göre iyileşme dönüştürücüden çok artımsal ama ölçekte önemli.

Kötü yaptığı şeyler

Önizleme kademesi değerlendirmeleri geçerlidir. Oran limitleri, bölgesel kullanılabilirlik ve belirli davranışlar genel kullanılabilirlikten önce değişebilir. Bugün kararlı davranışa ihtiyaç duyan üretim iş yükleri için 2.5 Pro daha muhafazakar seçim olmaya devam ediyor.

Pro kademesindeki gecikme, beklendiği gibi Flash kademelerinden daha yüksektir. 3.1 nesli bu temel takası değiştirmiyor; akıl yürütme derinliğini duvar saati zamanında ödüyorsunuz.

Pro kademesindeki çağrı başına maliyet kayda değerdir. Yüksek hacimli iş yükleri için Pro'da kalma gerekçesi, iş yükünüzün gerçekten üst kademe kaliteye ihtiyaç duyup duymadığına bağlıdır. Bir Flash varyantına geçmek, maliyete duyarlı kullanım senaryoları için çoğu zaman doğru karardır.

Kendi kendine barındırılan dağıtım menüde değil. Google, Gemini ağırlıklarını dağıtmıyor. Şirket içi gerektiren iş yükleri için /usecases/local adresindeki açık ağırlıklı inceleme doğru başlangıç noktasıdır.

Rekabet ortamındaki yeri

Daha önceki Pro anlık görüntülerine karşı — 2.5 Pro. 3.1 önizlemesi, önizleme kademesi davranışının kabul edilebilir olduğu yeni projeler için doğal yükseltmedir. 2.5 Pro üzerindeki mevcut üretim dağıtımları için göç gerekçesi, iyileştirmelerin özel iş yükünüz için önemli olup olmadığına bağlıdır.

3 Pro Preview hattına karşı. 3 Pro Preview, 3.x neslindeki daha geniş Pro kademe sunumudur; 3.1 Pro ise üzerine eklenen bir iyileştirmedir. En güncel yeteneklerden yararlanan iş yükleri için 3.1 Pro daha güncel seçimdir. 3 Pro Preview'in belirli davranışının zaten doğrulandığı iş yükleri için 3.1'e geçiş, 2.5'ten geçişe göre daha küçük bir sıçramadır.

Anthropic üst kademesine karşı. Claude Opus 4.7, farklı bir akıl yürütme stiliyle aynı 1M bağlam penceresini sunuyor — daha temkinli, daha açık, daha yavaş. Opus 4.7 ile 3.1 Pro Preview arasındaki seçim, Opus tarzı dikkatli akıl yürütme mi yoksa güçlü çok modlu işleme ile Gemini tarzı daha hızlı çıktı mı istediğinize bağlı.

OpenAI üst kademesine karşı. GPT-5 akıl yürütmede rekabet eder ve genellikle kısa promptlarda daha hızlıdır. 3.1 Pro Preview, görüntülerin ötesinde yerel çok modluluk ve sentez için anlamlı ölçüde kullanılabilir 1M bağlam penceresi konularında kazanır.

Kategori düzeyindeki tablo /benchmarks/leaderboard adresinde ve kategori başına puanlar /benchmarks/intelligence adresinde yer almaktadır.

Yanlış araç olduğu yerler

Bugün kararlı davranışa ihtiyaç duyan üretim iş yükleri. 3.x hattı genel kullanılabilirliğe ulaşana kadar 2.5 Pro'yu kullanın.

Yüksek hacimli ucuz sınıflandırma. Milyonlarca kısa prompt göndermek için üst kademe hesaplama yanlış şekilde bir harcamadır. Bir Flash varyantına geçin.

Gerçek zamanlı konuşma sesi. Yerel ses girişi yoktur. /usecases/voice adresindeki ses pipeline rehberi doğru mimariyi ele alır.

IDE uyumunun akıl yürütme derinliğinden daha önemli olduğu kod üretimi. Model kod konusunda yetkin ama uzmanlaşmış değil. /usecases/code adresindeki model incelemesi alternatifleri kapsar.

Büyük girişlerde saniyenin altında yanıt gerektiren herhangi bir şey. Bağlam penceresinin derinliğindeki gecikme gerçektir; zamana duyarlı uygulamalar için önbelleğe almalı daha küçük bir model daha uygun olabilir.

3.1 Pro Preview Custom Tools'tan farkı

3.1 Pro Preview'in Custom Tools varyantı, yapılandırılmış araç entegrasyonuna yoğun şekilde dayanan iş yükleri için uzmanlaşmış araç kullanım yetenekleri ekler. Standart araç kullanım davranışının yeterli olduğu iş yükleri için bu temel varyant doğru başlangıç noktasıdır. Uzmanlaşmış araç entegrasyonuna ihtiyaç duyan iş yükleri için Custom Tools varyantı tercih edilmelidir.

Dağıtım notları

Standart Google Gemini API. REST, akış, araç kullanımı, yapılandırılmış çıktı — hepsi Pro kademesi yetenek yüzeyi için beklendiği gibi davranır. İzleme, günlükleme ve güvenlik kontrolleri için daha geniş Vertex AI araçlarıyla entegrasyon temizdir.

Bölgesel kullanılabilirlik, Google'ın standart Vertex AI desenini takip eder. AB bölgeleri kurumsal sözleşmelerde mevcuttur. Hazır tüketici API erişimi bir bölgeye sabitlenmez. Sıkı yerleşiklik kısıtlamaları için Vertex AI bölgesel belgeleri doğru başvuru kaynağıdır.

Önizleme kademesi fiyatlandırması uzun vadeli maliyet modellemesinin temeli olmamalıdır. Genel kullanılabilirlikteki fiyatlandırma yapısı, önizleme kademesi oranlarından farklı olabilir.

Oran limitleri ve davranış kararlılığı, önizleme sırasında ana operasyonel hususlardır. Üretim göç planları, genel kullanılabilirlikten önce davranış değişiklikleri olasılığını hesaba katmalıdır.

Seçim kriterleri

Şu durumlarda Gemini 3.1 Pro Preview'a başvurun:

Gelecekteki üretim dağıtımı için yeni nesil üst kademe yetenekleri keşfediyorsanız.
İş yükü, akıl yürütme derinliği veya uzun bağlam sentezi konusunda 2.5 Pro tarafından kısıtlanıyordu.
Önizleme kademesi oran limitleri ve davranış değerlendirmeleri trafik şekliniz için kabul edilebilirse.
Zaten Google yığınındaysanız.

Şu durumlarda başka bir şey seçin:

Bugün üretimde kararlı davranışa ihtiyacınız varsa. 2.5 Pro'yu kullanın.
İş yükü bir Flash varyantı tarafından yeterince servis edilebiliyorsa. Maliyet için aşağı inin.
İş, yerel ses girişi, gerçek zamanlı ses veya video gerektiriyorsa.
Anthropic Opus tarzıyla eşleşen reddetme tutarlılığına ihtiyacınız varsa. Opus'a bakın.

Özet. 2.5 Pro üzerinde anlamlı ölçüde ilerleyen güçlü yeni nesil Pro kademesi anlık görüntüsü. Önizleme kademesi keşfi ve ileriye dönük tasarım için doğru başlangıç noktasıdır. Bugün üretimde kararlı dağıtımlar için, 3.x hattı genel kullanılabilirliğe ulaşana kadar 2.5 Pro muhafazakar seçim olmaya devam ediyor.

Aynı promptları /live-test adresinde 2.5 Pro ve 3.1 Pro Preview üzerinden çalıştırın. Deltalar en net şekilde kendi iş yükünüzde doğrudan karşılaştırmada ortaya çıkıyor.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Son otomatik test

26 Tem 2026 · 05:26 UTC · Test

P50 gecikme

4955 ms

P95 gecikme

—

Hatalar

0 / 6 çalıştırma

Son inceleyen Tokonomix Ekibi·26 Mayıs 2026