İçeriğe geç
Seviye C — Uzman
Çalıştığı yer:USYapıldığı yer:United States
Google Gemini

Gemini 3.1 Pro Preview

Seviye C — Uzman · 1.048576M token

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··

Gemini 3.1 Pro Preview, Google tarafından Gemini model ailesinin bir parçası olarak geliştirilen büyük bir dil modelidir. Bu model, 3.1 nesline ait deneysel bir önizleme sürümünü temsil etmekte olup Google'ın standart üretim modelleri ile öncü araştırma varyantları arasında konumlanmaktadır. Doğal dil anlama, akıl yürütme, içerik üretimi ve sohbet uygulamaları dahil olmak üzere genel amaçlı metin üretim görevleri için tasarlanmıştır. Modelin en dikkat çekici teknik özelliği, yaklaşık bir milyon token işleme kapasitesine denk gelen 1,048,576 token'lık bağlam penceresidir. Bu genişletilmiş bağlam uzunluğu, modelin tek bir etkileşimde önemli miktarda bilgiyi işleyebilmesini sağlayarak uzun belgeler, kapsamlı kod tabanları veya geniş geçmiş bağlam gerektiren konuşmaları içeren görevler için uygun hale getirmektedir. Model; görüntü işleme veya fonksiyon çağırma gibi çok modlu özellikler sunmaksızın standart metin üretim yetenekleri sağlar. Google'ın model yelpazesi içinde Gemini 3.1 Pro Preview, geliştiricilerin ve araştırmacıların yeni yetenekleri genel kullanıma sunulmadan önce test etmelerine olanak tanıyan bir ara seçenek olarak hizmet vermektedir. Bir önizleme sürümü olarak, kararlı üretim modellerine kıyasla farklı performans özellikleri sergileyebilir ve kullanıcı geri bildirimlerine dayalı değişikliklere veya iyileştirmelere tabi olabilir. Model, metin tabanlı uygulamalar için geniş bağlam pencerelerine ihtiyaç duyan ve önizleme aşamasındaki teknolojiyle çalışmaya istekli kullanıcılara yöneliktir.

Gemini 3.1 Pro Preview, Google'ın bir milyonun üzerinde token işleyebilen deneysel modellerinden biri olarak, uzun belge analizi ve kapsamlı bağlam gerektiren uygulamalar için tasarlanmış bir önizleme sürümü.

Tokonomix model değerlendirmesi
Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme14 runs
1188277243575941752505-2705-31ms
Bölüm 02

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

50
Kod üretimi
29
Çok dilli
15
Akıl yürütme
Bölüm 03

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — Gemini 3.1 Pro Preview
$2.00 1M giriş token başına
$12.00 1M çıkış token başına
≈ $0.0036 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$2.00
1M çıkış token başına$12.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.00

input / 1M

— stable

$12.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Bölüm 04

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)132 / avg 127
16795

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 05

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

1 milyon token bağlam penceresiUzun belge işleme kapasitesiYeni özelliklere erken erişimKapsamlı konuşma geçmişi desteğiGelişmiş doğal dil anlamaBüyük kod tabanı analiziGoogle model ailesi entegrasyonuGenel amaçlı metin üretimi

Zayıf yönler

Önizleme aşamasında kararsızlık riskiÇoklu ortam desteği yokFonksiyon çağrısı özelliği eksikC katmanı performans sınırlamaları
Bölüm 06

Yetenekler

toolssource: litellmvisionjson modepdf inputreasoningaudio inputjson schemaprompt cachingoutputTokenLimit: 65536max output tokens: 65536
Bölüm 07

Sık sorulan sorular

Gemini 3.1 Pro Preview bir önizleme sürümü olduğu için kararlı üretim modelleri kadar güvenilir değil. Davranışı geri bildirimlere göre değişebilir. Kritik üretim sistemleri için kararlı Gemini modellerini değerlendirmeniz önerilir.

Kararlı üretim modellerine alternatif arayan ve geniş bağlam penceresiyle deney yapmaya hazır geliştirici ve araştırmacılar için mantıklı bir seçim. Önizleme aşamasında olduğu için risk toleransı yüksek projeler için uygundur.

Tokonomix editör notu
Bölüm 08

Kullanılabilirlik

Kullanılabilirlik

Bu modelin çağrıldığında ne sıklıkla yanıt verdiği — son 30 gün içindeki gerçek API istekleri ve canlı testler üzerinden ölçülmüştür. Bu kaliteden bağımsızdır: bu sayılar yalnızca modelin yanıt verip vermediğini gösterir, yanıtın ne kadar iyi olduğunu değil.

Son 7 gün

100.0%

n=1

Son 30 gün

100.0%

n=1

Medyan yanıt süresi

16,761ms

n=1

Baz alınan 6 ölçüm son 30 gün içinde.

Teknik detaylar

Yalnızca gerçek API çağrıları ve canlı test istekleri sayılır — dahili yoklamalar ve kıyaslama çalıştırmaları hariçtir.

Özel API anahtarıyla (BYOK) yapılan çağrılar hariçtir: bu hatalar anahtara özgüdür, model kesintisinin işareti değildir.

Başarısız çağrılar kalite puanlarına DAHİL EDİLMEZ — kalite yalnızca başarılı yanıtlar üzerinden ölçülür. Kullanılabilirlik ve kalite bağımsız sinyallerdir.

Kaydedilmiş süreye sahip başarılı çağrılarda medyan yanıt süresi (p50). Aykırı değerler medyanı ortalamadan daha az etkiler.

Toplam çağrı (30d)

1

OK yanıtlar (30d)

1

Toplam çağrı (7d)

1

OK yanıtlar (7d)

1

Bölüm 09

Tokonomix kıyaslama kararları

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-548/100 · 76 runs
30 correct8 partial38 wrong39% accuracy
2026-06-14

Gemini 3.1 Pro Preview adds multimodal capabilities without benchmarks

Gemini 3.1 Pro Preview has undergone a significant expansion in capabilities since the previous evaluation period. The model now supports a comprehensive suite of features including vision, audio input, PDF processing, reasoning modes, and structured output formats through both JSON mode and JSON schema. Tool calling and prompt caching have also been added to the platform's feature set. However, no benchmark performance data is available for either the current or previous evaluation windows, making it impossible to assess the model's actual performance on standard tasks or compare quality metrics across time. The addition of multimodal inputs represents a substantial architectural evolution, positioning the model to handle diverse use cases from document analysis to audio processing. Users should note that while the capability expansion is impressive on paper, the absence of benchmark results means performance characteristics remain unvalidated. For production deployments, organizations will need to conduct their own evaluations to understand how these new capabilities perform in practice and whether quality has been maintained, improved, or degraded during this significant feature expansion.

Quality

Latency p50

Test runs

0

Vision and audio input added PDF processing now supported Structured output modes available No benchmark data available
Bölüm 10

Tam model profili

Gemini 3.1 Pro Preview — illustration 1
Gemini 3.1 Pro Preview: yeni nesil üst kademe

Not — ileriye dönük profil. Gemini 3.1 Pro Preview (gemini-3.1-pro-preview) bir önizleme anlık görüntüsüdür. Davranış, yetenekler ve oran limitleri, genel kullanılabilirlikten önce değişecektir.

Google'ın Gemini ailesindeki yeni nesil üst kademe giriş. 1.048.576 token'lık bağlam penceresi. Metin artı görsel giriş. Üretim ekiplerinin üzerine inşa ettiği mimari yüzeyi korurken Pro hattını 2.5 Pro nesline kıyasla ileriye taşıyan bir akıl yürütme derinliği.

Bu önizlemeye uyan çerçeveleme. 3.1 Pro, 2.5 Pro'nun güvendiğiniz üretim modeli olduğu ancak kalitenin sınırlayıcı faktör olduğu belirli bir iş yükünüz olduğunda başvuracağınız modeldir. 3.1 nesli bu boşluğun bir kısmını kapatıyor. Bu kapanmanın çalışan bir 2.5 Pro dağıtımından göçü haklı çıkarıp çıkarmadığı, özel durumunuza bağlıdır.

2.5 Pro'dan neler değişti

3.1 Pro nesli, 2.5 Pro'ya kıyasla çeşitli iyileştirmeler getiriyor:

  • Çok adımlı görevlerde daha keskin akıl yürütme. Düşünce zincirleri derinliğe doğru daha tutarlı kalıyor ve model, karmaşık problemlerde ara kısıtlamaları kaybetme olasılığı daha düşük.
  • Derinlikte daha iyi uzun bağlam dikkat kalitesi. 1M penceresi 2.5 Pro'da kullanılabilirdi; 3.1 Pro'da 400 bin token'lık girişin ötesinde sentez kalitesi anlamlı ölçüde daha sıkı.
  • Karmaşık iç içe şemalarda daha iyi yapılandırılmış çıktı uyumu. Araç kullanım çağrı yükleri daha güvenilir.
  • Yoğun belgelerde ve karmaşık grafiklerde daha güçlü görsel kalite.
  • Bir yanlış pozitifi hata ayıklayabilmenizi sağlayacak kadar görünür akıl yürütmeye sahip daha tutarlı reddetme duruşu.

Bunların hiçbiri tek başına dönüştürücü değil. Bileşik etki, bir üst kademenin yapması gerekenlerin daha fazlasını yapan bir üst kademedir.

İyi yaptığı şeyler

Manşet kombinasyonu 2.5 Pro ile aynı kalıyor: derinlikte sürdürülen dikkat kalitesine sahip bir milyon token'lık bağlam penceresi. 3.1 nesli her iki boyutu da ileriye taşıyor.

Çok adımlı akıl yürütme en görünür iyileşmedir. 2.5 Pro'nun dikkatli prompt mühendisliği ile üstesinden gelebildiği görevler artık daha basit promptlarla çalışıyor. 2.5 Pro'nun tutarlı bir şekilde başaramadığı görevler artık daha güvenilir çıktı üretiyor.

Görsel kalitesi 2.5 Pro'ya göre iyileşmiş durumda. Belge ekran görüntüleri, taranmış PDF'ler, gösterge paneli görüntüleri, grafikler, diyagramlar — yoğun veya karmaşık kaynaklarda daha özenli ele alınıyor. Tablo çıkarma daha güvenilir. Grafik açıklaması daha doğru büyüklük tahminleri içeriyor.

Araç kullanım güvenilirliği, savunmacı ayrıştırma yazmadan üretim ajan döngüleri oluşturmaya yetecek kadar güçlüdür. 2.5 Pro'ya göre iyileşme dönüştürücüden çok artımsal ama ölçekte önemli.

Kötü yaptığı şeyler

Önizleme kademesi değerlendirmeleri geçerlidir. Oran limitleri, bölgesel kullanılabilirlik ve belirli davranışlar genel kullanılabilirlikten önce değişebilir. Bugün kararlı davranışa ihtiyaç duyan üretim iş yükleri için 2.5 Pro daha muhafazakar seçim olmaya devam ediyor.

Pro kademesindeki gecikme, beklendiği gibi Flash kademelerinden daha yüksektir. 3.1 nesli bu temel takası değiştirmiyor; akıl yürütme derinliğini duvar saati zamanında ödüyorsunuz.

Pro kademesindeki çağrı başına maliyet kayda değerdir. Yüksek hacimli iş yükleri için Pro'da kalma gerekçesi, iş yükünüzün gerçekten üst kademe kaliteye ihtiyaç duyup duymadığına bağlıdır. Bir Flash varyantına geçmek, maliyete duyarlı kullanım senaryoları için çoğu zaman doğru karardır.

Kendi kendine barındırılan dağıtım menüde değil. Google, Gemini ağırlıklarını dağıtmıyor. Şirket içi gerektiren iş yükleri için /usecases/local adresindeki açık ağırlıklı inceleme doğru başlangıç noktasıdır.

Rekabet ortamındaki yeri

Daha önceki Pro anlık görüntülerine karşı — 2.5 Pro. 3.1 önizlemesi, önizleme kademesi davranışının kabul edilebilir olduğu yeni projeler için doğal yükseltmedir. 2.5 Pro üzerindeki mevcut üretim dağıtımları için göç gerekçesi, iyileştirmelerin özel iş yükünüz için önemli olup olmadığına bağlıdır.

3 Pro Preview hattına karşı. 3 Pro Preview, 3.x neslindeki daha geniş Pro kademe sunumudur; 3.1 Pro ise üzerine eklenen bir iyileştirmedir. En güncel yeteneklerden yararlanan iş yükleri için 3.1 Pro daha güncel seçimdir. 3 Pro Preview'in belirli davranışının zaten doğrulandığı iş yükleri için 3.1'e geçiş, 2.5'ten geçişe göre daha küçük bir sıçramadır.

Anthropic üst kademesine karşı. Claude Opus 4.7, farklı bir akıl yürütme stiliyle aynı 1M bağlam penceresini sunuyor — daha temkinli, daha açık, daha yavaş. Opus 4.7 ile 3.1 Pro Preview arasındaki seçim, Opus tarzı dikkatli akıl yürütme mi yoksa güçlü çok modlu işleme ile Gemini tarzı daha hızlı çıktı mı istediğinize bağlı.

OpenAI üst kademesine karşı. GPT-5 akıl yürütmede rekabet eder ve genellikle kısa promptlarda daha hızlıdır. 3.1 Pro Preview, görüntülerin ötesinde yerel çok modluluk ve sentez için anlamlı ölçüde kullanılabilir 1M bağlam penceresi konularında kazanır.

Kategori düzeyindeki tablo /benchmarks/leaderboard adresinde ve kategori başına puanlar /benchmarks/intelligence adresinde yer almaktadır.

Yanlış araç olduğu yerler

Bugün kararlı davranışa ihtiyaç duyan üretim iş yükleri. 3.x hattı genel kullanılabilirliğe ulaşana kadar 2.5 Pro'yu kullanın.

Yüksek hacimli ucuz sınıflandırma. Milyonlarca kısa prompt göndermek için üst kademe hesaplama yanlış şekilde bir harcamadır. Bir Flash varyantına geçin.

Gerçek zamanlı konuşma sesi. Yerel ses girişi yoktur. /usecases/voice adresindeki ses pipeline rehberi doğru mimariyi ele alır.

IDE uyumunun akıl yürütme derinliğinden daha önemli olduğu kod üretimi. Model kod konusunda yetkin ama uzmanlaşmış değil. /usecases/code adresindeki model incelemesi alternatifleri kapsar.

Büyük girişlerde saniyenin altında yanıt gerektiren herhangi bir şey. Bağlam penceresinin derinliğindeki gecikme gerçektir; zamana duyarlı uygulamalar için önbelleğe almalı daha küçük bir model daha uygun olabilir.

3.1 Pro Preview Custom Tools'tan farkı

3.1 Pro Preview'in Custom Tools varyantı, yapılandırılmış araç entegrasyonuna yoğun şekilde dayanan iş yükleri için uzmanlaşmış araç kullanım yetenekleri ekler. Standart araç kullanım davranışının yeterli olduğu iş yükleri için bu temel varyant doğru başlangıç noktasıdır. Uzmanlaşmış araç entegrasyonuna ihtiyaç duyan iş yükleri için Custom Tools varyantı tercih edilmelidir.

Dağıtım notları

Standart Google Gemini API. REST, akış, araç kullanımı, yapılandırılmış çıktı — hepsi Pro kademesi yetenek yüzeyi için beklendiği gibi davranır. İzleme, günlükleme ve güvenlik kontrolleri için daha geniş Vertex AI araçlarıyla entegrasyon temizdir.

Bölgesel kullanılabilirlik, Google'ın standart Vertex AI desenini takip eder. AB bölgeleri kurumsal sözleşmelerde mevcuttur. Hazır tüketici API erişimi bir bölgeye sabitlenmez. Sıkı yerleşiklik kısıtlamaları için Vertex AI bölgesel belgeleri doğru başvuru kaynağıdır.

Önizleme kademesi fiyatlandırması uzun vadeli maliyet modellemesinin temeli olmamalıdır. Genel kullanılabilirlikteki fiyatlandırma yapısı, önizleme kademesi oranlarından farklı olabilir.

Oran limitleri ve davranış kararlılığı, önizleme sırasında ana operasyonel hususlardır. Üretim göç planları, genel kullanılabilirlikten önce davranış değişiklikleri olasılığını hesaba katmalıdır.

Seçim kriterleri

Şu durumlarda Gemini 3.1 Pro Preview'a başvurun:

  • Gelecekteki üretim dağıtımı için yeni nesil üst kademe yetenekleri keşfediyorsanız.
  • İş yükü, akıl yürütme derinliği veya uzun bağlam sentezi konusunda 2.5 Pro tarafından kısıtlanıyordu.
  • Önizleme kademesi oran limitleri ve davranış değerlendirmeleri trafik şekliniz için kabul edilebilirse.
  • Zaten Google yığınındaysanız.

Şu durumlarda başka bir şey seçin:

  • Bugün üretimde kararlı davranışa ihtiyacınız varsa. 2.5 Pro'yu kullanın.
  • İş yükü bir Flash varyantı tarafından yeterince servis edilebiliyorsa. Maliyet için aşağı inin.
  • İş, yerel ses girişi, gerçek zamanlı ses veya video gerektiriyorsa.
  • Anthropic Opus tarzıyla eşleşen reddetme tutarlılığına ihtiyacınız varsa. Opus'a bakın.

Özet. 2.5 Pro üzerinde anlamlı ölçüde ilerleyen güçlü yeni nesil Pro kademesi anlık görüntüsü. Önizleme kademesi keşfi ve ileriye dönük tasarım için doğru başlangıç noktasıdır. Bugün üretimde kararlı dağıtımlar için, 3.x hattı genel kullanılabilirliğe ulaşana kadar 2.5 Pro muhafazakar seçim olmaya devam ediyor.

Aynı promptları /live-test adresinde 2.5 Pro ve 3.1 Pro Preview üzerinden çalıştırın. Deltalar en net şekilde kendi iş yükünüzde doğrudan karşılaştırmada ortaya çıkıyor.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Gemini 3.1 Pro Preview — illustration 2
Son otomatik test
14 Haz 2026 · 04:55 UTC · Test
P50 gecikme
6937 ms
P95 gecikme
Hatalar
0 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·26 Mayıs 2026