İçeriğe geç
Çalıştığı yer:USYapıldığı yer:United States
Google Gemini

Deep Research Preview (Apr-21-2026)

131K token

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··

Deep Research Preview (21 Nis 2026), Google'ın Gemini ailesinden, bilgi sentezi ve analitik akıl yürütmede ileri düzey yetenekler sergilemek üzere tasarlanmış deneysel bir modeldir. Bu model, sorguları bileşenlerine ayırarak, birden fazla kaynaktan ilgili bilgileri toplayarak ve bulguları tutarlı, iyi yapılandırılmış yanıtlara dönüştürerek karmaşık konularda kapsamlı araştırma yürütme konusunda uzmanlaşmıştır. Önizleme sürümü olarak konumlandırılmıştır; bu da geliştirici ve araştırmacıların geniş çaplı kullanıma sunulmadan önce araştırma odaklı yeteneklerini incelemesine olanak tanır. Model, 131.000 jetonluk bir bağlam penceresine sahiptir; bu sayede çok adımlı araştırma görevleri sırasında önemli miktarda bilgiyi işleyebilir ve tutarlılığı koruyabilir. Standart metin üretimini desteklese de mimarisi, genel amaçlı sohbet kullanımı yerine yinelemeli araştırma süreçleri için optimize edilmiştir. Bu uzmanlaşma, sistematik inceleme gerektiren konularda daha derin analiz yapmasına olanak tanır; ancak rutin metin üretim görevleri için en uygun tercih olmayabilir. Google'ın Gemini serisinde Deep Research Preview, genel amaçlı bir amiral gemisi modelden ziyade araştırma odaklı, uzmanlaşmış bir varyantı temsil eder. Otonom araştırma ve bilgi sentezi tekniklerinin gelecekteki üretim modellerine yön verebileceği bir test ortamı işlevi görür. Önizleme nitelendirmesi, Google'ın temel yaklaşımı kullanıcı geri bildirimi ve performans verilerine dayanarak rafine etmesiyle birlikte yeteneklerin ve davranışların değişebileceği, gelişmekte olan bir sistem olduğunu gösterir.

Deep Research Preview, Gemini ailesinin araştırma odaklı deneysel kolu olarak konumlanıyor; günlük sohbet motoru değil, çok adımlı analiz için tasarlanmış bir keşif aracı.

Tokonomix değerlendirme notu
Bölüm 01

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — Deep Research Preview (Apr-21-2026)
$2.00 1M giriş token başına
$12.00 1M çıkış token başına
≈ $0.0036 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$2.00
1M çıkış token başına$12.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.00

input / 1M

— no change

$12.00

output / 1M

— no change

2026-06-142026-06-142026-06-14
Input
Output
Price change
⟳ synced weekly
Bölüm 02

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

Çok adımlı araştırma yeteneğiKarmaşık sorguları bileşenlerine ayırma131K token bağlam penceresiAnalitik akıl yürütmede güçlüÇoklu kaynak senteziYapılandırılmış, tutarlı çıktılarYeni araştırma tekniklerine erken erişimGoogle Gemini altyapısı desteği

Zayıf yönler

Önizleme: davranış değişebilirGenel sohbet için optimize değilModalite ve fiyat detayları belirsizBilgi kesim tarihi netleştirilmemiş
Bölüm 03

Yetenekler

outputTokenLimit: 65536
Bölüm 04

Sık sorulan sorular

Önizleme statüsü nedeniyle kritik üretim yüklerinde önerilmez. Davranış ve API yüzeyi Google tarafından değiştirilebileceği için prototipleme ve değerlendirme senaryolarına daha uygundur.

Üretim hattına almak için henüz erken, ancak derin araştırma iş akışlarını prototiplemek isteyen ekipler için fazlasıyla ilgi çekici bir önizleme.

Tokonomix editör değerlendirmesi
Bölüm 05

Kullanılabilirlik

Kullanılabilirlik

Henüz ölçüm verisi yok

Bu model için kullanılabilirlik istatistiklerini göstermek için yeterli API çağrısı henüz kaydedilmedi. Veri, model canlı trafik almaya başlayınca görünür.

Bölüm 06

Tokonomix kıyaslama kararları

2026-06-14

Deep Research Preview maintains coding strength, math remains weak

Deep Research Preview by Google Gemini shows consistent performance across benchmark windows, with no significant changes in capabilities. The model continues to demonstrate strong coding proficiency with an 86.0% score on LiveCodeBench, maintaining its position as a solid choice for software development tasks. However, mathematical reasoning remains a notable weakness, with scores of 64.8% on MATH-500 and 71.9% on AIME 2024, both unchanged from the previous window. Multi-turn conversation handling shows moderate capability at 59.1% on MMLU, while instruction following on IFEval holds steady at 78.8%. The model handles multilingual tasks adequately with 76.2% on MGSM, and creative writing performance remains at 21.9% on Creative Writing. Overall benchmark average sits at 69.8%, identical to the previous period. This stability suggests a mature model with well-defined strengths in code generation and standard weaknesses in advanced mathematics. Users should leverage this model for coding tasks while being cautious about complex mathematical problem-solving scenarios. The unchanged performance profile makes it a predictable option for teams with established workflows.

Quality

Latency p50

Test runs

0

Coding performance remains strong Math scores still lagging Stable performance across benchmarks
Bölüm 07

Tam model profili

Deep Research Preview (Apr-21-2026) — illustration 1
Deep Research Preview (Nisan 2026): Google'ın araştırma yığınının temel katmanı

Not — ileriye dönük profil. Deep Research Preview (deep-research-preview-04-2026) Nisan 2026'dan alınan önizleme anlık görüntüsüdür. Davranış, yetenekler ve hız limitleri genel erişilebilirlik öncesinde değişecektir.

Deep Research Preview, Google'ın Deep Research serisindeki temel katmandır. 131.072 token'lık bağlam penceresi sunar. Temel yetenek olarak arama destekli üretim kullanır — model yalnızca eğitim verilerine güvenmek yerine çalışma sırasında canlı kaynakları çeker ve ileri sürdüğü iddialara kaynak gösterir.

Bu bir sohbet modeli değildir. Ayrıca ağır Max katmanı araştırma ajanı da değildir. Arama ve alıntı katmanı olarak ortada bir yerde konumlanır — Max'ten daha hızlı, üstüne arama aracı eklenmiş sade bir sohbet modelinden daha kapsamlı.

Gerçekte ne yapar

Ona güncel bilgiden ve açık kaynaklardan faydalanacak bir soru verirsiniz. Odaklanmış bir web araması yapar, en alakalı sonuçları okur ve kaynak materyalden alıntılar yapan yapılandırılmış bir cevap üretir. Tipik çıktı:

  • Soruya doğrudan yanıt.
  • Sorunun şekline bağlı olarak iki ila beş paragraf uzunluğunda kısa bir destekleyici özet.
  • Kullanılan kaynaklara satır içi alıntılar.
  • Sonunda başvurulan kaynaklar listesi.

Çalışmalar Max katmanı Deep Research'ten daha hızlıdır ve çıktı daha kısadır. Derin kaynak arası sentez yerine güncellik ve alıntı güvenilirliği için ödeme yaparsınız.

Gerçekten yararlı olduğu alanlar

Bu katmanın temiz bir şekilde uyduğu birkaç iş yükü:

  • Modelin eğitim kesim tarihinin doğru yanıtı kaçıracağı zamana duyarlı sorular.
  • Açık arama ve alıntı araçları olmayan bir sohbet modelinin ya referans uyduracağı ya da kararlı olmaktan kaçınacağı, alıntı gerektiren çıktılar.
  • Kullanıcının cevaba artı kaynağa bağlantıya ihtiyaç duyduğu mevcut belgelere, politika metinlerine veya haberlere karşı hızlı aramalar.
  • Max katmanı derin sentezin gecikme maliyetini haklı çıkarmayan hafif araştırmalar.

Desen şöyledir. Normalde üç dört sekme açacağınız, on dakika okuyacağınız ve bir paragraf yazacağınız görevler bu modele iyi haritalanır. Bir saatlik okuma gerektiren görevler Max'e gitmeli. Cevabın zaten eğitim verisinde olduğu görevlere arama desteği hiç gerekmez.

Yanlış araç olduğu yerler

Konuşma etkileşimleri. Deep Research ailesinin geri kalanı gibi, bu da istek-ve-yanıt şeklindedir, sohbet değil.

Çelişkili kanıtları olan birçok kaynak üzerinden derin sentez. Max katmanı bunu daha iyi yönetir. Temel önizleme daha hızlıdır ama daha az okuma yapar.

Gerçek araştırmanın dışındaki her şey. Kod üretimi, hata ayıklama, görüntü işleri — tamamen yanlış aile.

Çok yüksek hacimli iş yükleri. Arama ve alıntı döngüsü gecikme ekler ve çağrı başına sade bir sohbet tamamlamasından daha fazla hesaplama tüketir. Buna göre planlayın.

Aile içinde nasıl karşılaştırılır

Üç Deep Research önizleme anlık görüntüsü derinlik-hız eğrisi üzerinde farklı noktaları kapsar:

  • Deep Research Preview (Nisan 2026) — bu model. Temel katman, en hızlı, en kısa çıktılar.
  • Deep Research Pro Preview (Aralık 2025) — daha eski Pro katmanı, temel katmandan daha fazla derinlik, biraz daha eski ajan döngüsü.
  • Deep Research Max Preview (Nisan 2026) — en derin katman, en uzun çalışmalar, en kapsamlı çıktı.

Çoğu iş yükü için temel önizleme ile başlayın. Temel katmanın önemli kaynakları okunmamış bıraktığını veya alt akış kullanımınızın ihtiyaç duyduğu derinlikten yoksun çıktılar ürettiğini bulduğunuzda Pro veya Max'e yükseltin.

Diğer arama destekli modellerle nasıl karşılaştırılır

En doğrudan karşılaştırmalar, OpenAI'nin GPT-5 ailesi üzerindeki arama destekli modlar ve web arama aracı etkinleştirilmiş Anthropic'in Claude serisindedir. Çıktının şekli benzerdir: alıntılarla birlikte bir yanıt.

Google'ın temel Deep Research Preview'ı, ajan geniş bir arama yerine birden fazla hedefli arama yaptığı için tek-arama-çağrısı alternatifinden daha çeşitli kaynaklar ortaya çıkarma eğilimindedir. Çıktı varsayılan olarak daha yapılandırılmıştır ancak tarayıcılı GPT-5'in ürettiğinden daha az konuşkan şekildedir. Web aramalı Claude en temkinlidir, kaynaklar anlaşmadığında güvenle reddeder ve çıktıda çekincelerini daha görünür şekilde belirtme eğilimindedir.

Etkileşimli soru-ve-iyileştirme iş akışları için Claude veya GPT-5 daha iyi uyar. Kullanıcının alıntılarla birlikte eksiksiz bir cevap istediği ve bunun için on beş ila kırk saniye beklemeye razı olduğu tek atışlık sorular için Deep Research Preview güçlü bir varsayılandır.

Kategori düzeyindeki tablo /benchmarks/intelligence adresinde ve kayan sıralama tablosu /benchmarks/leaderboard adresinde bulunur.

Pratikte alıntı kalitesi

Alıntıların nasıl davrandığı hakkında bilmeniz gereken iki şey:

Birincisi, alıntılar gerçek kaynak içeriğini güvenilir bir şekilde izler. Model referans uydurmak alışkanlığında değildir ve bir kaynaktan bir pasaj alıntıladığında, pasaj genellikle o kaynakta mevcuttur. Bu, arama destekli modeller arasında evrensel değildir — bazı rakipler hâlâ ara sıra makul görünüşlü alıntılar icat eder.

İkincisi, alıntı kapsamı güncel ve yüksek trafikli kaynaklara doğru eğilim gösterir. Sorunuzun doğru yanıtı küçük bir arşiv sitesinde, bir devlet portalındaki bir PDF'de veya genel web aramasında iyi çıkmayan bir akademik makalede yaşıyorsa, modelin onu çekme olasılığı daha düşüktür. Doğru kaynakların yüksek trafikli webin dışında olduğu özel araştırma alanları için bu önemlidir.

Dağıtım notları

Standart Google Gemini API. Deep Research modelleri daha geniş Gemini yüzeyini paylaşır ancak açık bir model tanımlayıcısı gerektirir ve arama ve alıntı döngüsüne özgü parametreleri kabul eder.

Gecikme ana operasyonel husustur. Çağrılar tipik olarak soru karmaşıklığına bağlı olarak on beş ila kırk saniye sürer. Bunu kullanıcı deneyiminizde planlayın — ilerlemeyi gösterin, kullanıcı beklentilerini ayarlayın, kullanıcının saniyenin altı yanıt beklediği senkron bir etkileşimin arkasına koymayın.

Bölgesel erişilebilirlik Google'ın standart Vertex AI desenini takip eder. AB bölgeleri kurumsal sözleşmelerde mevcuttur; hazır API erişimi bir bölgeyi sabitlemiyor. Sert yerleşim kısıtlamaları için, genel API davranışına güvenmek yerine Vertex AI bölgesel belgelerine bakın.

Onu seçmek

Deep Research Preview'a şunlar için başvurun:

  • Açık alıntılarla güncel bilgiye ihtiyacınız var.
  • Soru tek-arama-çağrısı aramasından daha büyük ama çok saatlik bir araştırma özetinden daha küçük.
  • Alıntı güvenilirliği önemlidir ve kaynaklar anlaşmadığında modelin kendinden emin cevaplar uydurmak yerine temiz bir şekilde reddetmesini istersiniz.
  • On beş ila kırk saniyelik aralıktaki gecikme kullanım durumunuz için kabul edilebilir.

Şunlar söz konusu olduğunda başka bir şey seçin:

  • Soru iyileştirme için etkileşimli bir ileri-geri gerektiriyor.
  • Saniyenin altı gecikme gereksinimlerin bir parçası.
  • Soru birçok kaynak üzerinden derin sentez gerektiriyor — Max katmanı daha iyi uyuyor.
  • Cevap zaten eğitim verisinde ve arama desteği değer katmadan gecikme ekliyor.

Özet. Sağlam orta ağırlık araştırma aracı. Max'ten daha hızlı, sohbet-artı-arama alternatifinden daha kapsamlı, bu aile gönderilmeden önce temiz bir cevabı olmayan bir iş yükü bandına uyuyor.

/live-test adresinde güncel bir olay sorusu üzerinde deneyin. Alıntı kalitesi ayırt edicidir ve kendi sorularınıza karşı değerlendirmek en kolaydır.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Deep Research Preview (Apr-21-2026) — illustration 2
Son otomatik test
14 Haz 2026 · 04:54 UTC · Test
P50 gecikme
P95 gecikme
Hatalar
1 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·26 Mayıs 2026