İçeriğe geç
Seviye C — Uzman
Çalıştığı yer:USYapıldığı yer:United States
Google Gemini

Gemini 3 Flash Preview

Seviye C — Uzman · 1.048576M token

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··

Gemini 3 Flash Preview, Google tarafından Gemini model ailesinin bir parçası olarak geliştirilen büyük bir dil modelidir. Standart metin üretme görevleri için tasarlanmış olup geliştiricilere ve araştırmacılara gelişmiş doğal dil işleme yeteneklerine erişim sunar. Bu önizleme sürümü, Flash varyantının özelliklerine ve performans karakteristiklerine genel kullanıma sunulmadan önce erken erişim imkânı sağlar. Model, 1.048.576 token (1M token) gibi geniş bir bağlam penceresine sahip olup oldukça uzun belgeler, uzun süreli konuşmalar veya büyük kod tabanları boyunca tutarlılığı koruyarak işlem yapabilmektedir. Bu kapsamlı bağlam kapasitesi, uzun materyallerin analizini gerektiren uygulamalar, karmaşık çok turlu diyaloglar veya tek bir istem içinde geniş referans bilgilere erişimden yararlanan görevler için modeli özellikle uygun kılar. Google'ın Gemini serisi içinde Flash varyantı, yeteneği verimlilikle dengeleyen performans odaklı bir seçenek olarak konumlandırılır. Güçlü dil anlama ve üretme yeteneklerini korurken Flash modelleri, Ultra muadillerine kıyasla daha hızlı yanıt süreleri sunacak şekilde tasarlanmıştır; bu da gecikmenin önemli olduğu uygulamalar için onları uygun hale getirir. Önizleme tanımı, bu sürümün geliştirme döngüsü sırasında kullanıcıların modelin yeteneklerini değerlendirmesine ve geri bildirim sağlamasına olanak tanıyan bir ön sürüm olduğunu gösterir. Standart metin üretme yetenekleri arasında özetleme, soru yanıtlama, içerik oluşturma, kod üretimi ve konuşma tabanlı etkileşimler gibi görevler yer alır.

Google altyapısıyla desteklenen bu model, geniş bilgi tabanını etkin biçimde kullanıyor.

Tokonomix benchmark özeti
Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme14 runs
5337429501159136705-2705-31ms
Bölüm 02

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

87
Kod üretimi
98
Çok dilli
98
Akıl yürütme
Bölüm 03

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — Gemini 3 Flash Preview
$0.5000 1M giriş token başına
$3.00 1M çıkış token başına
≈ $0.0009 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$0.5000
1M çıkış token başına$3.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.5000

input / 1M

— stable

$3.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Bölüm 04

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)337 / avg 246
371156

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 05

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

Düşük gecikme, hızlı yanıt1M token bağlam penceresiMetin üretimi ve özetlemeÇok turlu sohbet desteğiTalimat takibinde yüksek başarıDoğal dil anlama kapasitesi

Zayıf yönler

Karmaşık akıl yürütmede sınırlıÖnizleme: özellikler değişebilirİnternet erişimi bulunmuyor
Bölüm 06

Yetenekler

toolssource: litellmvisionjson modepdf inputreasoningjson schemaparallel toolsprompt cachingoutputTokenLimit: 65536max output tokens: 65535
Bölüm 07

Sık sorulan sorular

Metin üretimi, içerik oluşturma, soru-cevap ve özetleme görevlerini destekleyen geniş bir uygulama yelpazesi sunuyor.

Google Gemini ekosistemiyle entegre çalışan bu model kurumsal iş akışlarını hızlandırıyor.

Tokonomix benchmark özeti
Bölüm 08

Kullanılabilirlik

Kullanılabilirlik

Henüz ölçüm verisi yok

Bu model için kullanılabilirlik istatistiklerini göstermek için yeterli API çağrısı henüz kaydedilmedi. Veri, model canlı trafik almaya başlayınca görünür.

Bölüm 09

Tokonomix kıyaslama kararları

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-576/100 · 74 runs
50 correct12 partial12 wrong68% accuracy
2026-06-14

Major capability expansion with tools, vision, and reasoning support added

Gemini 3 Flash Preview has undergone a significant transformation with the addition of eight new capabilities including tools, vision, JSON mode, PDF input, reasoning, JSON schema, parallel tools, and prompt caching. This represents a fundamental expansion from a text-only model to a multimodal platform with extensive integration options. The addition of tool calling and parallel tool execution enables sophisticated agent workflows, while vision and PDF input support broaden the range of input types the model can process. JSON schema support and JSON mode provide structured output capabilities essential for application integration. The reasoning capability suggests enhanced analytical performance, though benchmark scores are not available in the current window to quantify improvements. Prompt caching should improve efficiency for repetitive tasks. These additions position the model as a comprehensive solution for developers building complex applications that require multiple modalities and integration patterns. Users should note that while the capability set has dramatically expanded, performance metrics for the new benchmark window are pending, making it difficult to assess quality relative to the previous window where scores showed balanced improvements across categories.

Quality

Latency p50

Test runs

0

Eight new capabilities added Tool calling and vision support Multimodal input processing enabled Structured output via JSON schema
Bölüm 10

Tam model profili

Gemini 3 Flash Preview — illustration 1
Gemini 3 Flash Preview: yeni nesil Flash'ın ilk önizlemesi

Not — geleceğe dönük profil. Gemini 3 Flash Preview (gemini-3-flash-preview), 3.x Flash neslinin bir önizleme anlık görüntüsüdür. Davranış, yetenekler ve istek sınırları genel kullanıma sunulmadan önce değişecek ve büyük ihtimalle 3.1 Flash varyantlarına doğru kaymış.

Google'ın yeni nesil Flash katmanı modelinin ilk önizleme sürümü. 1.048.576 token context window. Metin ve görüntü girişi. 3.1 iyileştirmeleri gelmeden önce 3.x Flash serisini açan model.

Bu anlık görüntünün ailedir konumu özgün. Prodüksiyon-kararlı tercih değil — o 2.5 Flash. Aynı zamanda en güncel önizleme de değil — o 3.1 Flash varyantlarına taşındı. Çoğu iş yükü için bu ikisinden biri daha iyi başlangıç noktası. Bu önizleme, 3 Flash Preview'e erken yaşam döngüsünde sabitleyen ve henüz ileriye geçmeye hazır olmayan ekipler için yararlı olmayı sürdürüyor.

Bu anlık görüntünün bugünkü yeri

3 Flash Preview anlık görüntüsünün hâlâ doğru tercih olduğu birkaç durum:

  • Anlık görüntünün yaşam döngüsü genelinde kararlı karşılaştırmanın önemli olduğu, özellikle 3 Flash Preview'e karşı sabitlenmiş değerlendirmeler ve benchmark çalışmaları.
  • Bu sürüme karşı doğrulanmış ve henüz 3.1 Flash varyantlarına geçişi gerekçelendirememiş mevcut önizleme katmanı dağıtımlar.
  • 3.x Flash evrimini açıkça karşılaştıran ve en erken önizlemeye referans noktası olarak ihtiyaç duyan araştırmalar.

Bunların hiçbiri geçerli değilse, daha iyi güncel başlangıç noktaları: prodüksiyon-kararlı davranış için 2.5 Flash veya yeni nesil önizleme çalışması için 3.1 Flash varyantlarından biri.

İyi yaptığı şeyler

3.x nesil güçlü yönleri burada ilk biçimlerinde görünüyor:

  • Çok adımlı görevlerde 2.5 Flash nesline kıyasla daha keskin akıl yürütme.
  • Derinlikte iyileştirilmiş uzun context dikkat kalitesi — 1M pencere, 2.5 Flash'ın başardığından 200k tokenin ötesinde daha iyi bir arada tutuyor.
  • Karmaşık şemalarda daha iyi yapılandırılmış çıktı uyumu.
  • Standart belge okuma görevlerinde iyileştirilmiş görüntü kalitesi.
  • Daha büyük Gemini modelleriyle daha uyumlu reddetme tutumu.

2.5 Flash üzerindeki iyileştirmeler gerçek, ama 3.1 Flash varyantları bunları daha da geliştirdi. Henüz bir 3.x Flash anlık görüntüsüne taahhüt etmemiş iş yükleri için 3.1 varyantları daha güncel tercih.

Kötü yaptığı şeyler

Önizleme katmanı değerlendirmeleri geçerli. İstek sınırları, bölgesel kullanılabilirlik ve belirli davranışlar genel kullanıma sunulmadan önce değişebilir.

Bu anlık görüntü 3.x Flash neslinin ilk önizlemesini temsil ediyor. 3.1 varyantları bu sürümün hâlâ taşıdığı pürüzlü kenarları düzeltiyor. Bu iyileştirmelerin önemli olduğu iş yükleri için 3.1 varyantına geçiş daha iyi yol.

1M pencereli herhangi bir modelde olduğu gibi context penceresinde derinlikte gecikme gerçek. Zaman-duyarlı uygulamalar için, önbellekleme stratejileriyle küçük modeller daha iyi uyabilir.

Sahada ne durumda

2.5 Flash'a karşı: 3 Flash Preview, önizleme katmanı davranışı bedeli karşılığında akıl yürütme ve uzun context dikkatinde iyileştirmeler sunuyor. Prodüksiyon-kararlı dağıtımlar için 2.5 Flash hâlâ doğru tercih. Önizleme katmanı keşfetme için 3.x önizlemeleri doğru aile.

3.1 Flash varyantlarına karşı: 3.1 nesli 3 Flash Preview'in tanıttıklarını geliştiriyor. 3.x ailesindeki yeni inşaatlar için 3.1 varyantları daha güncel başlangıç noktası. 3 Flash Preview'den 3.1 Flash varyantına geçiş, 2.5 Flash'tan geçişe kıyasla küçük bir sıçrama.

Aynı banttaki rakiplere karşı: Orta katmanda Claude Sonnet, OpenAI'nin orta katman GPT-5 varyantları. Tercih tipik olarak ham yetenek farklarından çok ekosistem uyumuna ve belirli iş yükü özelliklerine göre şekilleniyor.

Kategori bazındaki tablo /benchmarks/leaderboard ve kategori bazındaki puanlar /benchmarks/intelligence sayfasında.

Gerçekten kullanışlı olduğu durumlar

Erken önizleme anlık görüntüsü olmasına karşın bazı iş yükleri temiz oturuyor:

  • 3 Flash Preview'e karşı doğrulanmış ve henüz 3.1'e geçişi gerekçelendirememiş mevcut önizleme katmanı dağıtımlar.
  • 3.x Flash evriminin sabitlenmiş karşılaştırma çalışmaları.
  • İstek sınırlarını yönetmek için yükü birden fazla önizleme anlık görüntüsü arasında dağıtan iş akışları.

Yanlış araç olduğu durumlar

Bugün kararlı davranışa ihtiyaç duyan prodüksiyon iş yükleri. 2.5 Flash kullanın.

2026'da yeni inşaatlar. Kararlılık gereksinimlerinize göre 3.1 Flash varyantlarından biriyle veya 2.5 Flash ile başlayın.

Üst katman akıl yürütme gerektiren iş yükleri. Pro katmanına çıkın — kararlılık için 2.5 Pro, güncel yetenek için 3.1 Pro Preview.

Yüksek hacimli ucuz sınıflandırma. Maliyet verimliliği için Flash-Lite'a inin.

Gerçek zamanlı ses. Audio girişi yok. /usecases/voice sayfasındaki ses hattı kılavuzu doğru mimariyi kapsıyor.

Geçiş yolları

3 Flash Preview'den doğrudan yollar:

  • Benzer yeteneklerle daha güncel önizleme davranışı için 3.1 Flash varyantlarından biri doğal hedef. Davranış genellikle mütevazı doğrulama çalışmasıyla yeterince yakın.
  • Prodüksiyon-kararlı dağıtım için 2.5 Flash muhafazakâr hedef. Yükseltme değil, geri dönüş.
  • Flash katmanını tamamen aşmış iş yükleri için 2.5 Pro veya 3.1 Pro Preview yukarı geçişi kapsıyor.

Taahhüt vermeden önce değerlendirme setinizi adaya karşı çalıştırın. Genel benchmark farkları belirli prompt'larınızda gördüklerinizle nadiren örtüşür ve bu, aynı aile içindeki önizlemeden-önizlemeye karşılaştırmalar için iki kat geçerli.

Dağıtım notları

Standart Google Gemini API. REST, streaming, tool-use, yapılandırılmış çıktı — hepsi Flash katmanı yetenek yüzeyi için beklenen biçimde çalışıyor.

Bölgesel kullanılabilirlik Google'ın standart Vertex AI kalıbını izliyor. AB bölgeleri kurumsal sözleşmelerde mevcut. Hazır tüketici API erişimi bölge sabitlemiyor. Zorunlu yerleşim kısıtlamaları için Vertex AI bölgesel belgeleri doğru başvuru kaynağı.

Önizleme katmanı fiyatlandırması uzun vadeli maliyet modellemesinin temeli olmamalı. Genel kullanım fiyatlandırma yapısı önizleme katmanı fiyatlarından farklı olabilir.

İstek sınırları ve davranış kararlılığı, önizleme sırasında başlıca operasyonel değerlendirmeler. İş yükleri davranış değişikliği olasılığını planlamalı ve aşağı yönlü sözleşmeleri modelin çıktılarına karşı doğrulamalı.

Tercih kriteri

Gemini 3 Flash Preview'e şu durumlarda uzanın:

  • Bu özgün anlık görüntüye karşı doğrulanmış mevcut önizleme katmanı dağıtımınız var.
  • Araştırma veya karşılaştırma nedenleriyle sabitlenmiş anlık görüntüye ihtiyacınız olduğunda.
  • 3.1 Flash varyantına geçiş henüz gerekçelendirilmediyse.

Başka bir şey seçin:

  • 2026'da sıfırdan başlıyorsanız. 2.5 Flash veya 3.1 Flash varyantlarından birini kullanın.
  • Bugün prodüksiyon-kararlı davranışa ihtiyacınız varsa. 2.5 Flash kullanın.
  • İş yükü 3.1 neslinin eklediği iyileştirmelere ihtiyaç duyuyorsa.
  • Çalışma audio, ses veya video ise.

Özet. 3.x Flash neslinin açılış önizlemesi. Yeni inşaatlar için 3.1 varyantları veya prodüksiyon 2.5 Flash genellikle daha iyi başlangıç noktası. Bu anlık görüntüye karşı doğrulanmış mevcut dağıtımlar için geçiş gerekçelenene kadar makul bir tercih olmayı sürdürüyor.

/live-test sayfasında kendi prompt'larınızda 2.5 Flash ve 3.1 Flash varyantlarıyla karşılaştırın.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Gemini 3 Flash Preview — illustration 2
Son otomatik test
14 Haz 2026 · 04:58 UTC · Test
P50 gecikme
2780 ms
P95 gecikme
Hatalar
0 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·24 Mayıs 2026