İçeriğe geç
Seviye A — Öncü
Çalıştığı yer:USYapıldığı yer:United States
Anthropic

Claude Sonnet 4.6

Seviye A — Öncü · 1M token

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··

Claude Sonnet 4.6, Anthropic tarafından geliştirilen ve Claude 3.5 model neslinin bir parçası olarak yayımlanan büyük bir dil modelidir. Claude 3.5 Sonnet üzerinde yinelemeli bir iyileştirmeyi temsil eder; akıl yürütme, kodlama ve genel metin üretimi görevlerinde geliştirilmiş performans sunarken Anthropic'in model ailesindeki Sonnet katmanını niteleyen dengeli yaklaşımı korur. Model, 200.000 token bağlam penceresine sahiptir ve çok turlu konuşmalar, içerik üretimi, analiz ve kodlama desteği dahil standart metin üretim yeteneklerini destekler. Claude Sonnet 4.6, müşteri desteği ve içerik üretiminden teknik dokümantasyon ve veri analizine kadar geniş bir uygulama yelpazesine uygun, çok yönlü bir genel amaçlı model olarak tasarlanmıştır. Hem metin girdileri hem de çıktıları işleyerek farklı alanlarda tutarlı ve bağlama uygun yanıtlar üretmeye odaklanır. Anthropic'in model serisinde Claude Sonnet 4.6, daha hızlı ve verimli Haiku modelleri ile daha yetenekli Opus modelleri arasında konumlanarak orta katmanda yer alır. Bu konumlanma, performans kalitesi ile hesaplama verimliliği arasında denge gerektiren uygulamalar için onu uygun kılar. Model, yanıtlarında yardımseverliği, zararsızlığı ve dürüstlüğü ön plana çıkaran Anthropic'in anayasal yapay zeka eğitim yaklaşımını benimser. Genellikle, amiral gemisi katman modellerin kaynak gereksinimleri olmadan güvenilir ve yüksek kaliteli dil üretiminin gerekli olduğu üretim ortamlarında devreye alınır.

Anthropic'in güvenlik odaklı mimarisi, bu modeli karmaşık görevlerde güvenilir kılıyor.

Tokonomix benchmark özeti
Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme97 runs
1522966578085941140805-2206-15ms
Bölüm 02

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

100
Kod üretimi
99
Çok dilli
99
Akıl yürütme
Bölüm 03

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — Claude Sonnet 4.6
$3.00 1M giriş token başına
$15.00 1M çıkış token başına
≈ $0.0048 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$3.00
1M çıkış token başına$15.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$3.00

input / 1M

— stable

$15.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Bölüm 04

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)188 / avg 178
130227

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 05

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

1M token bağlam penceresiConstitutional AI güvenlik katmanıKarmaşık talimat takibiPerformans ve hız dengesiÜretim ortamı güvenilirliğiMetin üretimi ve özetleme

Zayıf yönler

İnternet erişimi bulunmuyorGörsel işleme desteği yokBilgi kesim tarihi sonrası veri yok
Bölüm 06

Yetenekler

toolssource: litellmvisionjson modepdf inputreasoningjson schemaprompt cachingmax output tokens: 64000
Bölüm 07

Sık sorulan sorular

Metin üretimi, içerik oluşturma, soru-cevap ve özetleme görevlerini destekleyen geniş bir uygulama yelpazesi sunuyor.

Constitutional AI eğitim yöntemi zararlı çıktıları minimize eder ve uzun vadeli kullanım güvenliğini artırır.

Tokonomix benchmark özeti
Bölüm 08

Kullanılabilirlik

Kullanılabilirlik

Bu modelin çağrıldığında ne sıklıkla yanıt verdiği — son 30 gün içindeki gerçek API istekleri ve canlı testler üzerinden ölçülmüştür. Bu kaliteden bağımsızdır: bu sayılar yalnızca modelin yanıt verip vermediğini gösterir, yanıtın ne kadar iyi olduğunu değil.

Son 7 gün

100.0%

n=24

Son 30 gün

100.0%

n=24

Medyan yanıt süresi

5,590ms

n=24

Baz alınan 92 ölçüm son 30 gün içinde.

Teknik detaylar

Yalnızca gerçek API çağrıları ve canlı test istekleri sayılır — dahili yoklamalar ve kıyaslama çalıştırmaları hariçtir.

Özel API anahtarıyla (BYOK) yapılan çağrılar hariçtir: bu hatalar anahtara özgüdür, model kesintisinin işareti değildir.

Başarısız çağrılar kalite puanlarına DAHİL EDİLMEZ — kalite yalnızca başarılı yanıtlar üzerinden ölçülür. Kullanılabilirlik ve kalite bağımsız sinyallerdir.

Kaydedilmiş süreye sahip başarılı çağrılarda medyan yanıt süresi (p50). Aykırı değerler medyanı ortalamadan daha az etkiler.

Toplam çağrı (30d)

24

OK yanıtlar (30d)

24

Toplam çağrı (7d)

24

OK yanıtlar (7d)

24

Bölüm 09

Tokonomix kıyaslama kararları

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-596/100 · 76 runs
73 correct3 partial0 wrong96% accuracy
2026-06-14

Claude Sonnet 4.6 adds multimodal capabilities with comparable performance

Claude Sonnet 4.6 introduces significant feature expansions while maintaining its core performance characteristics. The model now supports vision, PDF input, tool use, and structured output modes including JSON schema validation. A reasoning mode has been added for complex problem-solving tasks. These additions transform Claude Sonnet from a text-only model into a versatile multimodal system capable of processing documents and images alongside text. Performance across traditional benchmarks remains largely stable, with no significant degradation in text-based capabilities. The feature set now approaches parity with leading multimodal models, positioning Claude Sonnet as a comprehensive solution for diverse use cases. Users should note that while the capability surface has expanded dramatically, the core performance profile has not shown measurable improvement in traditional text tasks. The additions are primarily about breadth rather than depth, making this update most valuable for users requiring multimodal processing, structured outputs, or tool integration. Existing text-only workflows should continue performing as expected without disruption.

Quality

Latency p50

Test runs

0

Vision and PDF support added Tool use and reasoning enabled Structured JSON output modes Stable text performance maintained
Bölüm 10

Tam model profili

Claude Sonnet 4.6 — illustration 1
Claude Sonnet 4.6: Opus fiyat etiketi olmaksızın milyon token orta katman

Claude Sonnet 4.6 (claude-sonnet-4-6), 200k context tavanını kıran Sonnet anlık görüntüsüdür. Bir milyon token context window. Metin ve görüntü girişi. Claude ailesinde ilk kez Opus katmanı bedeli ödemeksizin çok uzun girişleri makul bir seçenek haline getiren orta katman model.

Bu anlık görüntüye en uygun çerçeveleme: Sonnet 4.6, Sonnet tarzı güvenilirlik ve reddetme tutumu istediğinizde ama iş yükü 200k token içine sığmadığında uzanılan model. Genel Sonnet serisinden daha dar bir kullanım alanı bandı, ama bu anlık görüntü çıkmadan önce iyi bir yanıtı olmayan bir band.

Milyon token penceresi gerçekte ne kazandırıyor

Bir milyon token, tam bir çeyreklik kazanç klasörü, orta boy bir monorepo ya da aylarca süren sohbet dizisi için yeterli. Pazarlama sloganı gerçek. Pratik soru, her uzun context modelinde geçerli olanla aynı: dikkat kalitesi tampon bellek genelinde koruluyor mu, yoksa arka taraf dolunca model başa gömülü gerçekleri yitiriyor mu?

Sonnet 4.6, Sonnet serisinin geri kalanının çarptığı uçurumun — 200k tokenin — çok ötesinde dikkatini koruyor. Yaklaşık 600k tokenin ötesinde gecikmenin uzadığını ve akış token/sn düştüğünü görüyorsunuz. Ayrıntılı rakamlar döngüden döngüye değişiyor; canlı tablo /benchmarks/speed sayfasında.

İki pratik çıkarım. Birincisi, uzun pencere çapraz belge durum tespiti, tam repo kod incelemesi ve uzun-sohbet konuşma durumu gibi şeyler için gerçekten kullanılabilir — slayta yazılacak bir özellik listesi rakamı değil. İkincisi, aynı büyük corpus'a yönelik tekrarlayan sorgular için prompt önbelleklemeyi düşünmek yine de değerli. Her çağrıda 800k token context yeniden yüklemek, API çağrısının kendisi başarılı olsa bile gerçek zamanlı süre açısından pahalı.

Opus 4.7 ile uzun context karşılaştırması

Hem Sonnet 4.6 hem Opus 4.7 milyon token penceresiyle geliyor. Fark beklediğiniz türden:

  • Opus 4.7 daha dikkatli, daha temkinli; yanıtlamadan önce daha uzun iç adım zincirlerinden geçerek akıl yürütüyor.
  • Sonnet 4.6 aynı girişte daha hızlı ve alternatifleri işlemeden ilk güvenilir yoruma yakın yanıtlar üretiyor.
  • Salt erişim için — "bu 800k tokenlik belgede şu gerçeği bul" — ikisi birbirine yakın. Dağınık birçok gerçek genelinde sentez için Opus genellikle kazanıyor.
  • Üst yığın akıl yürütmeye özellikle ihtiyaç duymadığınız maliyet-duyarlı uzun context iş yükleri için Sonnet 4.6 doğru tercih.

Kendi prompt'larınızla çalıştırın. Gerçek iş yüklerindeki farklar nadiren genel benchmark farklarıyla örtüşür.

Ağırlığını taşıyan görüntü girişi

Sonnet 4.6, 4.x serisinin görüntü yığınını koruyor. Belge ekran görüntüleri, sayfa görseli olarak işlenmiş taranmış PDF'ler, pano yakaları, diyagramlar. Tablo çıkarımı temiz. Makul etiket boyutlu grafikler doğru biçimde tanımlanıyor.

Claude ailesinin geri kalanındakiyle aynı zayıf noktalar. El yazısı tutarsız. Küçük eksen etiketli yoğun bilimsel şekiller kısmen yanlış okunuyor. Kaynağı okumak için yakınlaştırmak gereken her şey, doğrulama adımından yararlanıyor.

Görüntü girişini uzun context penceresiyle birleştiren iş yükleri için — söz gelimi, yapılandırılmış meta veriyle birlikte sayfa görseli olarak işlenmiş eksiksiz bir PDF — Sonnet 4.6 sahada en yetenekli seçimlerden biri. Gemini 3 Pro Preview burada kabaca eşit zeminde rekabet ediyor.

Sahada ne durumda

Sonnet 4.6 için dürüst rekabet tablosu:

Opus 4.7'ye karşı: Sonnet 4.6 daha hızlı ve işletme maliyeti daha düşük; Opus 4.7, karmaşık görevlerde daha dikkatli akıl yürütüyor. Modelin işi uzun bir girişten gerçekleri çıkarmak ve özetlemek olan iş yükleri için genellikle Sonnet yeterli. Uzun bir giriş üzerinde çok adımlı akıl yürütme içeren iş yükleri için Opus daha iyi tercih.

Gemini 2.5 Pro ve GPT-5 orta katmana karşı: Sonnet 4.6, reddetme tutarlılığı ve Avrupalı dillerde idari düzyazıda kazanıyor. Gemini, görüntülerin ötesinde yerel çok modalitede kazanıyor. GPT-5 orta katman, kısa konuşmalı durumlarda ham hızda kazanıyor.

Kategori bazındaki tablo /benchmarks/leaderboard ve /benchmarks/intelligence sayfalarında.

Yanlış araç olduğu durumlar

200k tokenin yeterli olduğu iş yükleri. Sonnet 4.5, penceresi içinde benzer davranışla daha düşük işletme maliyetine sahip. Milyon token yeteneği, gecikme ve operasyonel karmaşıklık açısından bir bedel taşıyor; buna ihtiyacınız yoksa ödemeniz gerekmiyor.

Gerçek zamanlı ses. Audio girişi yok. /usecases/voice sayfasındaki ses hattı kılavuzu doğru mimariyi kapsıyor.

Yüksek hacimli ucuz sınıflandırma. Uzun context yetenekli modellerde orta katman hesaplama, milyonlarca kısa prompt göndermek için yanlış bütçe kullanımı. Claude Haiku 4.5 veya küçük Gemini Flash varyantlarından biri bunu farklı bir maliyet katmanında yapıyor.

Hızlı gelişen framework'lerde kod üretimi. Muhafazakâr çıktı tarzı. IDE uyumlu çalışmalar için /usecases/code sayfasındaki anket alternatifleri kapsıyor.

Kendi kendinize barındırma veya ince ayar. Anthropic ağırlık dağıtmıyor. Bu kısıtlamalar geçerliyse /usecases/local sayfasındaki açık ağırlıklı anket doğru başlangıç noktası.

Dağıtım notları

Standart Anthropic API. REST. Streaming. System prompt'lar tahmin edilebilir davranıyor. Tool-use, prodüksiyon ajanı inşa etmeye yetecek kadar güvenilir.

AB veri yerleşimi yinelenen çıkmaz nokta olmayı sürdürüyor. Anthropic'in inference'ı AWS ve Google Cloud üzerinde çalışıyor; public API, herhangi bir Claude modeli için bölge seçim parametresi sunmuyor. Hazır kullanımda yalnızca AB inference yolu garantilenmiyor. Kurumsal sözleşmeler yerleşim maddeleri müzakere edebilir. Zorunlu yerleşim kısıtlamaları için /usecases/local sayfasındaki açık ağırlıklı seçenekler doğru başlangıç noktası.

Günlükler varsayılan olarak kötüye kullanım izleme için otuz gün saklanıyor. Girişler opt-in olmadıkça eğitimde kullanılmıyor. Sıfır saklama bir ayar değil, sözleşme müzakeresi.

Tercih kriteri

Claude Sonnet 4.6'ya şu durumlarda uzanın:

  • İş yükü düzenli olarak 200k token girişini aşıyorsa.
  • Opus katmanı akıl yürütme derinliği yerine Sonnet tarzı hız ve reddetme tutumu istediğinizde.
  • Uzun pencerenin hakkını kazandığı çapraz belge durum tespiti, tam repo kod incelemesi veya benzeri görevler yürütüyorsanız.
  • Avrupalı dillerde idari veya hukuki metin girişin parçasıysa.

Başka bir şey seçin:

  • İş yükü 200k token içine rahatça sığıyorsa. Sonnet 4.5 kullanın.
  • Uzun giriş üzerinde üst yığın akıl yürütme gerekiyorsa. Opus 4.7'ye çıkın.
  • Kısa prompt'larda çağrı başı alt-sent maliyet gerekiyorsa. Haiku'ya inin.
  • Audio, ses veya video iş yükunun parçasıysa.

Özet. Sonnet 4.6, uzun context orta katman iş yükleri için doğru yanıt. Her şey için doğru yanıt değil ve bu sorun değil. Kendi bandı için piyasadaki en güçlü modellerden biri.

/live-test sayfasında kendi uzun context prompt'unuzla deneyin. Modeller arasındaki fark, giriş bunları zorlayacak kadar büyük olduğunda en belirgin görünüyor.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Claude Sonnet 4.6 — illustration 2Claude Sonnet 4.6 — illustration 3
Son otomatik test
15 Haz 2026 · 08:00 UTC · Hız testi
P50 gecikme
1064 ms
P95 gecikme
1127 ms
Hatalar
0 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·24 Mayıs 2026