1M token bağlam penceresi günlük kullanımda ne işe yarıyor?

Uzun belgeler, kapsamlı raporlar veya çok turlu konuşma geçmişini tek seansta işlemenize olanak tanıyor.

Anthropic modellerini diğer sağlayıcılardan ayıran temel özellik nedir?

Güvenlik odaklı Constitutional AI ve şeffaf politikalar.

Bu modeli üretimde kullanmadan önce nelere dikkat etmeli?

Hız, maliyet ve doğruluk açısından kendi kullanım senaryonuzu test edin; bağlam ve çıkarım maliyetleri kritik faktörlerdir.

Bu model ince ayar destekliyor mu?

Güncel API dokümantasyonunu kontrol etmeniz önerilir; destek sürüme göre değişebilir.

Seviye A — Öncü

Çalıştığı yer:USYapıldığı yer:United States

Anthropic

Claude Sonnet 4.6

Seviye A — Öncü · 1M token

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan·Yayınlandı 22 Mayıs 2026·Son inceleme 24 Mayıs 2026

Claude Sonnet 4.6, Anthropic tarafından geliştirilen ve Claude 3.5 model neslinin bir parçası olarak yayımlanan büyük bir dil modelidir. Claude 3.5 Sonnet üzerinde yinelemeli bir iyileştirmeyi temsil eder; akıl yürütme, kodlama ve genel metin üretimi görevlerinde geliştirilmiş performans sunarken Anthropic'in model ailesindeki Sonnet katmanını niteleyen dengeli yaklaşımı korur. Model, 200.000 token bağlam penceresine sahiptir ve çok turlu konuşmalar, içerik üretimi, analiz ve kodlama desteği dahil standart metin üretim yeteneklerini destekler. Claude Sonnet 4.6, müşteri desteği ve içerik üretiminden teknik dokümantasyon ve veri analizine kadar geniş bir uygulama yelpazesine uygun, çok yönlü bir genel amaçlı model olarak tasarlanmıştır. Hem metin girdileri hem de çıktıları işleyerek farklı alanlarda tutarlı ve bağlama uygun yanıtlar üretmeye odaklanır. Anthropic'in model serisinde Claude Sonnet 4.6, daha hızlı ve verimli Haiku modelleri ile daha yetenekli Opus modelleri arasında konumlanarak orta katmanda yer alır. Bu konumlanma, performans kalitesi ile hesaplama verimliliği arasında denge gerektiren uygulamalar için onu uygun kılar. Model, yanıtlarında yardımseverliği, zararsızlığı ve dürüstlüğü ön plana çıkaran Anthropic'in anayasal yapay zeka eğitim yaklaşımını benimser. Genellikle, amiral gemisi katman modellerin kaynak gereksinimleri olmadan güvenilir ve yüksek kaliteli dil üretiminin gerekli olduğu üretim ortamlarında devreye alınır.

Claude Sonnet 4.6 ile kendi sorularını test et

Anthropic'in güvenlik odaklı mimarisi, bu modeli karmaşık görevlerde güvenilir kılıyor.
— Tokonomix benchmark özeti

Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme101 runs

Bölüm 02

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

Yaratıcı

Olgusal

100

Çok dilli

100

Akıl yürütme

Bölüm 03

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰

API tarifeleri — Claude Sonnet 4.6

$3.00 1M giriş token başına

$15.00 1M çıkış token başına

≈ $0.0048 tipik konuşma başına (800 token)

Giriş vs çıkış fiyatı (1M token başına)

1M giriş token başına$3.00

1M çıkış token başına$15.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$3.00

input / 1M

— stable

$15.00

output / 1M

— stable

2026-05-242026-06-282026-07-26

Input

Output

Price change

⟳ synced weekly

Bölüm 04

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)92 / avg 169

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 05

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

1M token bağlam penceresiConstitutional AI güvenlik katmanıKarmaşık talimat takibiPerformans ve hız dengesiÜretim ortamı güvenilirliğiMetin üretimi ve özetleme

Zayıf yönler

İnternet erişimi bulunmuyorGörsel işleme desteği yokBilgi kesim tarihi sonrası veri yok

Bölüm 06

Yetenekler

toolssource: litellmvisionjson modepdf inputreasoningjson schemaprompt cachingmax output tokens: 64000

Bölüm 07

Sık sorulan sorular

Metin üretimi, içerik oluşturma, soru-cevap ve özetleme görevlerini destekleyen geniş bir uygulama yelpazesi sunuyor.

Constitutional AI eğitim yöntemi zararlı çıktıları minimize eder ve uzun vadeli kullanım güvenliğini artırır.
— Tokonomix benchmark özeti

Bölüm 08

Kullanılabilirlik

Bu modelin çağrıldığında ne sıklıkla yanıt verdiği — son 30 gün içindeki gerçek API istekleri ve canlı testler üzerinden ölçülmüştür. Bu kaliteden bağımsızdır: bu sayılar yalnızca modelin yanıt verip vermediğini gösterir, yanıtın ne kadar iyi olduğunu değil.

Son 7 gün

100.0%

n=42

Son 30 gün

100.0%

n=305

Medyan yanıt süresi

18,379ms

n=305

Baz alınan 685 ölçüm son 30 gün içinde.

Teknik detaylar

Yalnızca gerçek API çağrıları ve canlı test istekleri sayılır — dahili yoklamalar ve kıyaslama çalıştırmaları hariçtir.

Özel API anahtarıyla (BYOK) yapılan çağrılar hariçtir: bu hatalar anahtara özgüdür, model kesintisinin işareti değildir.

Başarısız çağrılar kalite puanlarına DAHİL EDİLMEZ — kalite yalnızca başarılı yanıtlar üzerinden ölçülür. Kullanılabilirlik ve kalite bağımsız sinyallerdir.

Kaydedilmiş süreye sahip başarılı çağrılarda medyan yanıt süresi (p50). Aykırı değerler medyanı ortalamadan daha az etkiler.

Toplam çağrı (30d)

305

OK yanıtlar (30d)

305

Toplam çağrı (7d)

OK yanıtlar (7d)

Bölüm 09

Tokonomix kıyaslama kararları

⚖️

Endorsed by 2 judges

Independent LLM judges evaluated this model on our weekly intelligence tests

cohere/command-a100/100 · 1 runs

1 correct0 partial0 wrong100% accuracy

claude-sonnet-4-596/100 · 116 runs

111 correct5 partial0 wrong96% accuracy

● 2026-07-26

Claude Sonnet 4.6 adds multimodal and structured output capabilities

Claude Sonnet 4.6 introduces significant new capabilities while maintaining its existing performance profile. The model now supports vision input for image analysis, tool calling for function execution, and multiple structured output formats including JSON mode and JSON schema validation. PDF input processing and prompt caching have also been added, expanding the model's utility for document-heavy workflows. A new reasoning mode enables more deliberate problem-solving approaches. These additions position Sonnet 4.6 as a more versatile option for developers building multimodal applications. However, no benchmark performance data is available for this window, making it impossible to assess whether core capabilities like instruction following, mathematical reasoning, or coding performance have improved, regressed, or remained stable compared to the previous evaluation period. Users should expect the same baseline model quality as before, now augmented with these additional modalities and output controls. The new features align Sonnet 4.6 with industry trends toward multimodal AI systems, though quantitative validation of performance across these new capabilities remains pending.

Quality

—

Latency p50

—

Test runs

✓ Vision and PDF input added✓ Structured output formats supported✓ Tool calling now available✓ Reasoning mode introduced

Bölüm 10

Tam model profili

Claude Sonnet 4.6: Opus fiyat etiketi olmaksızın milyon token orta katman

Claude Sonnet 4.6 (claude-sonnet-4-6), 200k context tavanını kıran Sonnet anlık görüntüsüdür. Bir milyon token context window. Metin ve görüntü girişi. Claude ailesinde ilk kez Opus katmanı bedeli ödemeksizin çok uzun girişleri makul bir seçenek haline getiren orta katman model.

Bu anlık görüntüye en uygun çerçeveleme: Sonnet 4.6, Sonnet tarzı güvenilirlik ve reddetme tutumu istediğinizde ama iş yükü 200k token içine sığmadığında uzanılan model. Genel Sonnet serisinden daha dar bir kullanım alanı bandı, ama bu anlık görüntü çıkmadan önce iyi bir yanıtı olmayan bir band.

Milyon token penceresi gerçekte ne kazandırıyor

Bir milyon token, tam bir çeyreklik kazanç klasörü, orta boy bir monorepo ya da aylarca süren sohbet dizisi için yeterli. Pazarlama sloganı gerçek. Pratik soru, her uzun context modelinde geçerli olanla aynı: dikkat kalitesi tampon bellek genelinde koruluyor mu, yoksa arka taraf dolunca model başa gömülü gerçekleri yitiriyor mu?

Sonnet 4.6, Sonnet serisinin geri kalanının çarptığı uçurumun — 200k tokenin — çok ötesinde dikkatini koruyor. Yaklaşık 600k tokenin ötesinde gecikmenin uzadığını ve akış token/sn düştüğünü görüyorsunuz. Ayrıntılı rakamlar döngüden döngüye değişiyor; canlı tablo /benchmarks/speed sayfasında.

İki pratik çıkarım. Birincisi, uzun pencere çapraz belge durum tespiti, tam repo kod incelemesi ve uzun-sohbet konuşma durumu gibi şeyler için gerçekten kullanılabilir — slayta yazılacak bir özellik listesi rakamı değil. İkincisi, aynı büyük corpus'a yönelik tekrarlayan sorgular için prompt önbelleklemeyi düşünmek yine de değerli. Her çağrıda 800k token context yeniden yüklemek, API çağrısının kendisi başarılı olsa bile gerçek zamanlı süre açısından pahalı.

Opus 4.7 ile uzun context karşılaştırması

Hem Sonnet 4.6 hem Opus 4.7 milyon token penceresiyle geliyor. Fark beklediğiniz türden:

Opus 4.7 daha dikkatli, daha temkinli; yanıtlamadan önce daha uzun iç adım zincirlerinden geçerek akıl yürütüyor.
Sonnet 4.6 aynı girişte daha hızlı ve alternatifleri işlemeden ilk güvenilir yoruma yakın yanıtlar üretiyor.
Salt erişim için — "bu 800k tokenlik belgede şu gerçeği bul" — ikisi birbirine yakın. Dağınık birçok gerçek genelinde sentez için Opus genellikle kazanıyor.
Üst yığın akıl yürütmeye özellikle ihtiyaç duymadığınız maliyet-duyarlı uzun context iş yükleri için Sonnet 4.6 doğru tercih.

Kendi prompt'larınızla çalıştırın. Gerçek iş yüklerindeki farklar nadiren genel benchmark farklarıyla örtüşür.

Ağırlığını taşıyan görüntü girişi

Sonnet 4.6, 4.x serisinin görüntü yığınını koruyor. Belge ekran görüntüleri, sayfa görseli olarak işlenmiş taranmış PDF'ler, pano yakaları, diyagramlar. Tablo çıkarımı temiz. Makul etiket boyutlu grafikler doğru biçimde tanımlanıyor.

Claude ailesinin geri kalanındakiyle aynı zayıf noktalar. El yazısı tutarsız. Küçük eksen etiketli yoğun bilimsel şekiller kısmen yanlış okunuyor. Kaynağı okumak için yakınlaştırmak gereken her şey, doğrulama adımından yararlanıyor.

Görüntü girişini uzun context penceresiyle birleştiren iş yükleri için — söz gelimi, yapılandırılmış meta veriyle birlikte sayfa görseli olarak işlenmiş eksiksiz bir PDF — Sonnet 4.6 sahada en yetenekli seçimlerden biri. Gemini 3 Pro Preview burada kabaca eşit zeminde rekabet ediyor.

Sahada ne durumda

Sonnet 4.6 için dürüst rekabet tablosu:

Opus 4.7'ye karşı: Sonnet 4.6 daha hızlı ve işletme maliyeti daha düşük; Opus 4.7, karmaşık görevlerde daha dikkatli akıl yürütüyor. Modelin işi uzun bir girişten gerçekleri çıkarmak ve özetlemek olan iş yükleri için genellikle Sonnet yeterli. Uzun bir giriş üzerinde çok adımlı akıl yürütme içeren iş yükleri için Opus daha iyi tercih.

Gemini 2.5 Pro ve GPT-5 orta katmana karşı: Sonnet 4.6, reddetme tutarlılığı ve Avrupalı dillerde idari düzyazıda kazanıyor. Gemini, görüntülerin ötesinde yerel çok modalitede kazanıyor. GPT-5 orta katman, kısa konuşmalı durumlarda ham hızda kazanıyor.

Kategori bazındaki tablo /benchmarks/leaderboard ve /benchmarks/intelligence sayfalarında.

Yanlış araç olduğu durumlar

200k tokenin yeterli olduğu iş yükleri. Sonnet 4.5, penceresi içinde benzer davranışla daha düşük işletme maliyetine sahip. Milyon token yeteneği, gecikme ve operasyonel karmaşıklık açısından bir bedel taşıyor; buna ihtiyacınız yoksa ödemeniz gerekmiyor.

Gerçek zamanlı ses. Audio girişi yok. /usecases/voice sayfasındaki ses hattı kılavuzu doğru mimariyi kapsıyor.

Yüksek hacimli ucuz sınıflandırma. Uzun context yetenekli modellerde orta katman hesaplama, milyonlarca kısa prompt göndermek için yanlış bütçe kullanımı. Claude Haiku 4.5 veya küçük Gemini Flash varyantlarından biri bunu farklı bir maliyet katmanında yapıyor.

Hızlı gelişen framework'lerde kod üretimi. Muhafazakâr çıktı tarzı. IDE uyumlu çalışmalar için /usecases/code sayfasındaki anket alternatifleri kapsıyor.

Kendi kendinize barındırma veya ince ayar. Anthropic ağırlık dağıtmıyor. Bu kısıtlamalar geçerliyse /usecases/local sayfasındaki açık ağırlıklı anket doğru başlangıç noktası.

Dağıtım notları

Standart Anthropic API. REST. Streaming. System prompt'lar tahmin edilebilir davranıyor. Tool-use, prodüksiyon ajanı inşa etmeye yetecek kadar güvenilir.

AB veri yerleşimi yinelenen çıkmaz nokta olmayı sürdürüyor. Anthropic'in inference'ı AWS ve Google Cloud üzerinde çalışıyor; public API, herhangi bir Claude modeli için bölge seçim parametresi sunmuyor. Hazır kullanımda yalnızca AB inference yolu garantilenmiyor. Kurumsal sözleşmeler yerleşim maddeleri müzakere edebilir. Zorunlu yerleşim kısıtlamaları için /usecases/local sayfasındaki açık ağırlıklı seçenekler doğru başlangıç noktası.

Günlükler varsayılan olarak kötüye kullanım izleme için otuz gün saklanıyor. Girişler opt-in olmadıkça eğitimde kullanılmıyor. Sıfır saklama bir ayar değil, sözleşme müzakeresi.

Tercih kriteri

Claude Sonnet 4.6'ya şu durumlarda uzanın:

İş yükü düzenli olarak 200k token girişini aşıyorsa.
Opus katmanı akıl yürütme derinliği yerine Sonnet tarzı hız ve reddetme tutumu istediğinizde.
Uzun pencerenin hakkını kazandığı çapraz belge durum tespiti, tam repo kod incelemesi veya benzeri görevler yürütüyorsanız.
Avrupalı dillerde idari veya hukuki metin girişin parçasıysa.

Başka bir şey seçin:

İş yükü 200k token içine rahatça sığıyorsa. Sonnet 4.5 kullanın.
Uzun giriş üzerinde üst yığın akıl yürütme gerekiyorsa. Opus 4.7'ye çıkın.
Kısa prompt'larda çağrı başı alt-sent maliyet gerekiyorsa. Haiku'ya inin.
Audio, ses veya video iş yükunun parçasıysa.

Özet. Sonnet 4.6, uzun context orta katman iş yükleri için doğru yanıt. Her şey için doğru yanıt değil ve bu sorun değil. Kendi bandı için piyasadaki en güçlü modellerden biri.

/live-test sayfasında kendi uzun context prompt'unuzla deneyin. Modeller arasındaki fark, giriş bunları zorlayacak kadar büyük olduğunda en belirgin görünüyor.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Son otomatik test

30 Tem 2026 · 08:06 UTC · Hız testi

P50 gecikme

2173 ms

P95 gecikme

2547 ms

Hatalar

0 / 6 çalıştırma

Son inceleyen Tokonomix Ekibi·24 Mayıs 2026