
Claude Sonnet 4.6 (claude-sonnet-4-6), 200k context tavanını kıran Sonnet anlık görüntüsüdür. Bir milyon token context window. Metin ve görüntü girişi. Claude ailesinde ilk kez Opus katmanı bedeli ödemeksizin çok uzun girişleri makul bir seçenek haline getiren orta katman model.
Bu anlık görüntüye en uygun çerçeveleme: Sonnet 4.6, Sonnet tarzı güvenilirlik ve reddetme tutumu istediğinizde ama iş yükü 200k token içine sığmadığında uzanılan model. Genel Sonnet serisinden daha dar bir kullanım alanı bandı, ama bu anlık görüntü çıkmadan önce iyi bir yanıtı olmayan bir band.
Milyon token penceresi gerçekte ne kazandırıyor
Bir milyon token, tam bir çeyreklik kazanç klasörü, orta boy bir monorepo ya da aylarca süren sohbet dizisi için yeterli. Pazarlama sloganı gerçek. Pratik soru, her uzun context modelinde geçerli olanla aynı: dikkat kalitesi tampon bellek genelinde koruluyor mu, yoksa arka taraf dolunca model başa gömülü gerçekleri yitiriyor mu?
Sonnet 4.6, Sonnet serisinin geri kalanının çarptığı uçurumun — 200k tokenin — çok ötesinde dikkatini koruyor. Yaklaşık 600k tokenin ötesinde gecikmenin uzadığını ve akış token/sn düştüğünü görüyorsunuz. Ayrıntılı rakamlar döngüden döngüye değişiyor; canlı tablo /benchmarks/speed sayfasında.
İki pratik çıkarım. Birincisi, uzun pencere çapraz belge durum tespiti, tam repo kod incelemesi ve uzun-sohbet konuşma durumu gibi şeyler için gerçekten kullanılabilir — slayta yazılacak bir özellik listesi rakamı değil. İkincisi, aynı büyük corpus'a yönelik tekrarlayan sorgular için prompt önbelleklemeyi düşünmek yine de değerli. Her çağrıda 800k token context yeniden yüklemek, API çağrısının kendisi başarılı olsa bile gerçek zamanlı süre açısından pahalı.
Opus 4.7 ile uzun context karşılaştırması
Hem Sonnet 4.6 hem Opus 4.7 milyon token penceresiyle geliyor. Fark beklediğiniz türden:
- Opus 4.7 daha dikkatli, daha temkinli; yanıtlamadan önce daha uzun iç adım zincirlerinden geçerek akıl yürütüyor.
- Sonnet 4.6 aynı girişte daha hızlı ve alternatifleri işlemeden ilk güvenilir yoruma yakın yanıtlar üretiyor.
- Salt erişim için — "bu 800k tokenlik belgede şu gerçeği bul" — ikisi birbirine yakın. Dağınık birçok gerçek genelinde sentez için Opus genellikle kazanıyor.
- Üst yığın akıl yürütmeye özellikle ihtiyaç duymadığınız maliyet-duyarlı uzun context iş yükleri için Sonnet 4.6 doğru tercih.
Kendi prompt'larınızla çalıştırın. Gerçek iş yüklerindeki farklar nadiren genel benchmark farklarıyla örtüşür.
Ağırlığını taşıyan görüntü girişi
Sonnet 4.6, 4.x serisinin görüntü yığınını koruyor. Belge ekran görüntüleri, sayfa görseli olarak işlenmiş taranmış PDF'ler, pano yakaları, diyagramlar. Tablo çıkarımı temiz. Makul etiket boyutlu grafikler doğru biçimde tanımlanıyor.
Claude ailesinin geri kalanındakiyle aynı zayıf noktalar. El yazısı tutarsız. Küçük eksen etiketli yoğun bilimsel şekiller kısmen yanlış okunuyor. Kaynağı okumak için yakınlaştırmak gereken her şey, doğrulama adımından yararlanıyor.
Görüntü girişini uzun context penceresiyle birleştiren iş yükleri için — söz gelimi, yapılandırılmış meta veriyle birlikte sayfa görseli olarak işlenmiş eksiksiz bir PDF — Sonnet 4.6 sahada en yetenekli seçimlerden biri. Gemini 3 Pro Preview burada kabaca eşit zeminde rekabet ediyor.
Sahada ne durumda
Sonnet 4.6 için dürüst rekabet tablosu:
Opus 4.7'ye karşı: Sonnet 4.6 daha hızlı ve işletme maliyeti daha düşük; Opus 4.7, karmaşık görevlerde daha dikkatli akıl yürütüyor. Modelin işi uzun bir girişten gerçekleri çıkarmak ve özetlemek olan iş yükleri için genellikle Sonnet yeterli. Uzun bir giriş üzerinde çok adımlı akıl yürütme içeren iş yükleri için Opus daha iyi tercih.
Gemini 2.5 Pro ve GPT-5 orta katmana karşı: Sonnet 4.6, reddetme tutarlılığı ve Avrupalı dillerde idari düzyazıda kazanıyor. Gemini, görüntülerin ötesinde yerel çok modalitede kazanıyor. GPT-5 orta katman, kısa konuşmalı durumlarda ham hızda kazanıyor.
Kategori bazındaki tablo /benchmarks/leaderboard ve /benchmarks/intelligence sayfalarında.
Yanlış araç olduğu durumlar
200k tokenin yeterli olduğu iş yükleri. Sonnet 4.5, penceresi içinde benzer davranışla daha düşük işletme maliyetine sahip. Milyon token yeteneği, gecikme ve operasyonel karmaşıklık açısından bir bedel taşıyor; buna ihtiyacınız yoksa ödemeniz gerekmiyor.
Gerçek zamanlı ses. Audio girişi yok. /usecases/voice sayfasındaki ses hattı kılavuzu doğru mimariyi kapsıyor.
Yüksek hacimli ucuz sınıflandırma. Uzun context yetenekli modellerde orta katman hesaplama, milyonlarca kısa prompt göndermek için yanlış bütçe kullanımı. Claude Haiku 4.5 veya küçük Gemini Flash varyantlarından biri bunu farklı bir maliyet katmanında yapıyor.
Hızlı gelişen framework'lerde kod üretimi. Muhafazakâr çıktı tarzı. IDE uyumlu çalışmalar için /usecases/code sayfasındaki anket alternatifleri kapsıyor.
Kendi kendinize barındırma veya ince ayar. Anthropic ağırlık dağıtmıyor. Bu kısıtlamalar geçerliyse /usecases/local sayfasındaki açık ağırlıklı anket doğru başlangıç noktası.
Dağıtım notları
Standart Anthropic API. REST. Streaming. System prompt'lar tahmin edilebilir davranıyor. Tool-use, prodüksiyon ajanı inşa etmeye yetecek kadar güvenilir.
AB veri yerleşimi yinelenen çıkmaz nokta olmayı sürdürüyor. Anthropic'in inference'ı AWS ve Google Cloud üzerinde çalışıyor; public API, herhangi bir Claude modeli için bölge seçim parametresi sunmuyor. Hazır kullanımda yalnızca AB inference yolu garantilenmiyor. Kurumsal sözleşmeler yerleşim maddeleri müzakere edebilir. Zorunlu yerleşim kısıtlamaları için /usecases/local sayfasındaki açık ağırlıklı seçenekler doğru başlangıç noktası.
Günlükler varsayılan olarak kötüye kullanım izleme için otuz gün saklanıyor. Girişler opt-in olmadıkça eğitimde kullanılmıyor. Sıfır saklama bir ayar değil, sözleşme müzakeresi.
Tercih kriteri
Claude Sonnet 4.6'ya şu durumlarda uzanın:
- İş yükü düzenli olarak 200k token girişini aşıyorsa.
- Opus katmanı akıl yürütme derinliği yerine Sonnet tarzı hız ve reddetme tutumu istediğinizde.
- Uzun pencerenin hakkını kazandığı çapraz belge durum tespiti, tam repo kod incelemesi veya benzeri görevler yürütüyorsanız.
- Avrupalı dillerde idari veya hukuki metin girişin parçasıysa.
Başka bir şey seçin:
- İş yükü 200k token içine rahatça sığıyorsa. Sonnet 4.5 kullanın.
- Uzun giriş üzerinde üst yığın akıl yürütme gerekiyorsa. Opus 4.7'ye çıkın.
- Kısa prompt'larda çağrı başı alt-sent maliyet gerekiyorsa. Haiku'ya inin.
- Audio, ses veya video iş yükunun parçasıysa.
Özet. Sonnet 4.6, uzun context orta katman iş yükleri için doğru yanıt. Her şey için doğru yanıt değil ve bu sorun değil. Kendi bandı için piyasadaki en güçlü modellerden biri.
/live-test sayfasında kendi uzun context prompt'unuzla deneyin. Modeller arasındaki fark, giriş bunları zorlayacak kadar büyük olduğunda en belirgin görünüyor.
Son teknik inceleme: 2026-05-22 — Tokonomix.ai

