İçeriğe geç
Seviye B — Üretim
Çalıştığı yer:USYapıldığı yer:United States
Anthropic

Claude Sonnet 4.5

Seviye B — Üretim · 200K token

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··

Claude Sonnet 4.5, Anthropic tarafından geliştirilen ve Claude 3.5 model ailesinin bir parçası olarak yayımlanan bir büyük dil modelidir. Önceki Sonnet sürümleri üzerinde yinelemeli bir iyileştirmeyi temsil eder ve Anthropic'in ürün yelpazesindeki Sonnet katmanını niteleyen performans-verimlilik dengesini korur. Model; analiz, içerik üretimi, kodlama desteği ve sohbet etkileşimleri dahil olmak üzere genel amaçlı metin üretimi görevleri için tasarlanmıştır. Model, 200.000 token'lık bir bağlam penceresine sahiptir; bu sayede tek bir sohbet ya da belge analizi oturumunda önemli miktarda metni işleyebilir ve tutarlılığı koruyabilir. Claude Sonnet 4.5, standart metin tabanlı giriş ve çıkışları destekler; görüntü veya ses işleme için yerel çok modlu yetenekler sunmaz. Mimarisi; talimat takibini, olgusal doğruluğu ve yanıtlarda uygun sınırların korunmasını önceliklendirir. Anthropic'in model hiyerarşisinde Sonnet, daha hızlı ve uygun maliyetli Haiku modelleri ile daha yetkin ancak kaynak yoğun Opus katmanı arasında orta konumu işgal eder. Bu konumlandırma, Claude Sonnet 4.5'i amiral gemisi modellerin işlem yükü olmadan çeşitli görevlerde güvenilir performans gerektiren uygulamalar için uygun kılar. Modele Anthropic'in API'si ve seçili iş ortağı platformları üzerinden erişilebilir; müşteri hizmetleri otomasyonundan kurumsal ve bireysel geliştirici bağlamlarında yazılım geliştirme desteği ile belge analizine kadar uzanan kullanım senaryolarına hizmet eder.

Anthropic'in güvenlik odaklı mimarisi, bu modeli karmaşık görevlerde güvenilir kılıyor.

Tokonomix benchmark özeti
Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme97 runs
147216741886208822805-2206-15ms
Bölüm 02

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

100
Kod üretimi
100
Çok dilli
100
Akıl yürütme
Bölüm 03

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — Claude Sonnet 4.5
$3.00 1M giriş token başına
$15.00 1M çıkış token başına
≈ $0.0048 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$3.00
1M çıkış token başına$15.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$3.00

input / 1M

— stable

$15.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Bölüm 04

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)135 / avg 162
134277

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 05

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

200K token uzun bağlamConstitutional AI güvenlik katmanıKarmaşık talimat takibiPerformans ve hız dengesiÜretim ortamı güvenilirliğiMetin üretimi ve özetleme

Zayıf yönler

İnternet erişimi bulunmuyorGörsel işleme desteği yokBilgi kesim tarihi sonrası veri yok
Bölüm 06

Yetenekler

toolssource: litellmvisionjson modepdf inputreasoningjson schemaprompt cachingmax output tokens: 64000
Bölüm 07

Sık sorulan sorular

Metin üretimi, içerik oluşturma, soru-cevap ve özetleme görevlerini destekleyen geniş bir uygulama yelpazesi sunuyor.

Constitutional AI eğitim yöntemi zararlı çıktıları minimize eder ve uzun vadeli kullanım güvenliğini artırır.

Tokonomix benchmark özeti
Bölüm 08

Kullanılabilirlik

Kullanılabilirlik

Henüz ölçüm verisi yok

Bu model için kullanılabilirlik istatistiklerini göstermek için yeterli API çağrısı henüz kaydedilmedi. Veri, model canlı trafik almaya başlayınca görünür.

Bölüm 09

Tokonomix kıyaslama kararları

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-596/100 · 76 runs
74 correct2 partial0 wrong97% accuracy
2026-06-14

Major capability expansion with tools, vision, and reasoning added

Claude Sonnet 4.5 has undergone a significant transformation with the addition of seven new capabilities: tools, vision, JSON mode, PDF input, reasoning, JSON schema, and prompt caching. This represents a fundamental expansion of the model's functionality beyond its previous text-only interface. The addition of vision capabilities allows the model to process images, while tools and JSON schema support enable structured interactions for application development. PDF input expands document handling, and the reasoning capability suggests enhanced problem-solving approaches. Prompt caching can improve efficiency for repeated interactions. These changes position Claude Sonnet 4.5 as a more versatile model suitable for multimodal applications and complex workflows. Users who previously relied on this model for text-only tasks will find it now supports a much broader range of use cases, from visual analysis to structured data extraction and tool-augmented reasoning. The scale of these additions indicates a major version update rather than incremental improvements, fundamentally changing what developers and users can accomplish with this model.

Quality

Latency p50

Test runs

0

Tools capability added Vision support enabled JSON schema support added PDF input now supported
Bölüm 10

Tam model profili

Claude Sonnet 4.5 — illustration 1
Claude Sonnet 4.5: hakkını kazanan prodüksiyon orta katmanı

Claude Sonnet 4.5 (claude-sonnet-4-5-20250929), Eylül 2025 sonu Sonnet anlık görüntüsüdür. İki yüz bin token context window. Metin ve görüntü girişi. En geniş prodüksiyon Claude dağıtım kitlesinin sonunda kullandığı orta katman model.

Bu anlık görüntüye en uygun çerçeveleme: Sonnet 4.5, Opus'a bakıp akıl yürütme kalitesinin gerçekte ihtiyaç duyduklarından fazla olduğuna karar veren ve Haiku'ya bakıp derinliğin istediklerinden az olduğuna karar veren ekiplerin uzandığı model. Ortada, kasıtlı olarak ve ortayı iyi yapacak şekilde oturuyor.

Bu anlık görüntünün tutunmasının nedeni

4.5'te aynı anda inen birkaç şey, Sonnet 4.0 üzerinde çalışan ekipler için varsayılan yükseltme hedefine dönüştürdü:

  • Daha temiz JSON şema uyumu. Önceki Sonnet anlık görüntüleri, karmaşık iç içe şemalarda zaman zaman alan adlarında sapıyordu. 4.5, sözleşmeyi güvenilir biçimde tutuyor.
  • Daha sıkı reddetme tutumu. Model, önceki Sonnet anlık görüntülerinin gösterdiği biraz farklı tutum yerine Opus ile aynı akıl yürütme tarzıyla sınır prompt'larını reddediyor.
  • Daha tahmin edilebilir system-prompt işleme. System prompt ile kullanıcı prompt çakıştığında, 4.5 birini sessizce önceliklendirmek yerine ikisini de tartar.
  • Daha iyi uzun biçimli çıktı bütünlüğü. Çok paragraflı yanıtlar, önceki Sonnet anlık görüntülerinin zaman zaman sürüklendiği kendini tekrarlama olmaksızın bir arada duruyor.

Bunların hiçbiri benchmark başlığı değil. Tümü, on bin istek başına arızaları sayarken ajan döngüsü veya yapılandırılmış çıkarım hattı çalıştırdığınızda önem taşıyor.

200k pencere ne kazandırıyor

İki yüz bin token, ciddi bir kod tabanı, uzun bir çeyreklik rapor veya çok belgeli bir titizlik klasörü için yeterli. Sonnet 4.5, tamponun büyük bölümünde makul biçimde dikkatini koruyor; olağan uyarıyla: çok uzun girişlerin ortasında iğne bulma kalitesi bir miktar düşüyor.

İş yükünüz düzenli olarak 150k token girişini aşıyorsa iki pratik seçenek var. 4.5 üzerinde kalın ve modeli context'e bağlı tutmak için prompt mühendisliği kalıpları kullanın — soruyu context sonunda tekrarlayın, girişi net bölüm başlıklarıyla yapılandırın. Ya da derinlikte anlamlı ölçüde daha iyi dikkatle milyon token penceresi sunan Sonnet 4.6'ya geçin. Güncel gecikme tablosu /benchmarks/speed sayfasında.

İşini yapan görüntü girişi

4.5'teki görüntü yetenekleri standart belge okuma görevleri için çalışıyor. Ekran görüntüleri, sayfa görseli olarak işlenmiş taranmış PDF'ler, pano yakaları, diyagramlar. Tablo çıkarımı temiz. Makul etiket boyutlu grafikler doğru biçimde tanımlanıyor.

El yazısı zayıf nokta. Küçük etiketli yoğun bilimsel şekiller de öyle. Kaynağı okumak için yakınlaştırmak gereken her şey, döngüde insan doğrulama adımından yararlanıyor.

Görüntü yığını 4.x serisi genelinde paylaşılıyor. Sonnet 4.5'i Opus 4.5 veya Haiku 4.5 ile özellikle görüntü için değerlendiriyorsanız, katmana göre olağan kalite gradiyanıyla benzer davranış bekleyin.

Sahada ne durumda

2026 ortasında Sonnet 4.5 için dürüst rekabet tablosu:

Daha yeni Anthropic Sonnet anlık görüntülerine karşı: Sonnet 4.6 doğal yükseltme hedefi. Aynı giriş yüzeyini taşıyor; artı milyon token context penceresi ve tool-use cilasına yönelik artımlı iyileştirmeler. 200k token içine sığan iş yükleri için tercih büyük ölçüde yetenek değil operasyonel kararla belirleniyor.

GPT-5 orta katman ve Gemini 2.5 Pro'ya karşı: Sonnet 4.5, kategoriye göre dönüşümlü zaferler paylaşıyor. Reddetme tutarlılığı, Avrupalı dillerde idari düzyazı, yapılandırılmış çıktı güvenilirliğinde kazanıyor. Kısa konuşmalı durumlarda ham hız ve görüntülerin ötesinde yerel çok modalite girişinde kaybediyor.

Yan yana karşılaştırma için /benchmarks/leaderboard süregelen tabloyu güncel tutuyor ve kategori puanları /benchmarks/intelligence sayfasında ayrışıyor.

Yanlış araç olduğu durumlar

Yüksek hacimli ucuz sınıflandırma. Milyonlarca kısa prompt göndermek için orta katman hesaplama yanlış bütçe kullanımı. Claude Haiku 4.5 veya Gemini 2.5 Flash bunu, basit görevlerde anlamlı kalite kaybı olmaksızın farklı bir maliyet katmanında yapıyor.

Gerçek zamanlı ses. Sonnet 4.5'in audio girişi yok. /usecases/voice sayfasındaki ses hattı kılavuzu doğru mimariyi kapsıyor.

Gerçekten üst yığın akıl yürütme gerektiren iş yükleri. Göreviniz çok adımlı biçimsel akıl yürütme, büyük kod tabanlarında karmaşık yeniden düzenleme veya birçok belge genelinde dikkatli sentez içeriyorsa, Opus katmanı doğru tercih. Sonnet 4.5 iyi; Opus bu özel durumlar için daha iyi.

Deyimsel çıktı istediğiniz hızlı gelişen framework'lerde kod üretimi. Model yeterli ama muhafazakâr. IDE uyumlu çalışmalar için /usecases/code sayfasındaki anket seçenekleri karşılaştırıyor.

Kendi kendinize barındırma veya ince ayar. Anthropic ağırlık dağıtmıyor ve Sonnet katmanında denetimli ince ayar sunmuyor. Bu kısıtlamalar için açık ağırlıklı seçenekler /usecases/local sayfasında inceleniyor.

Dağıtım notları

Standart Anthropic API. REST. Streaming. System prompt'lar tahmin edilebilir davranıyor. Tool-use çağrı kalitesi, savunmacı parsing yazmaksızın prodüksiyon ajanı inşa etmeye yetecek kadar yüksek.

Veri yerleşimi tablosu, Claude serisinin geri kalanıyla aynı. Inference AWS ve Google Cloud üzerinde çalışıyor; public API bölge seçim parametresi sunmuyor. AB yerleşimi bir ayar değil, kurumsal sözleşme müzakeresi gerektiriyor. Zorunlu yerleşim kısıtlamaları için OVH-hosted alternatiflere bakın.

Günlükler varsayılan olarak kötüye kullanım izleme için otuz gün saklanıyor. Girişler opt-in olmadıkça eğitimde kullanılmıyor. Sıfır saklama kurumsal sözleşme maddesi.

Tercih kriteri

Claude Sonnet 4.5'e şu durumlarda uzanın:

  • En güncel yerine en prodüksiyona hazır Sonnet anlık görüntüsünü istediğinizde.
  • İş yükü 200k token context içine sığıyorsa.
  • Yapılandırılmış çıktı güvenilirliği ve reddetme tutarlılığı tasarımınız için önemliyse.
  • Terminoloji sadakatinin önemli olduğu Avrupalı dillerde idari veya hukuki metin işliyorsanız.

Başka bir şey seçin:

  • Düzenli olarak 200k tokenden fazla context gerekiyorsa. Sonnet 4.6'ya geçin.
  • Amiral gemisi seviyesinde akıl yürütme gerekiyorsa. Opus'a çıkın.
  • Çağrı başı alt-sent maliyet gerekiyorsa. Haiku'ya inin.
  • Audio, ses veya video iş yükunun parçasıysa.

Özet. Sonnet 4.5, prodüksiyon için güvenli orta katman seçim. Daha yeni anlık görüntüler öncü cephede daha yetenekli, ama 4.5 çoğu ekibin uzanacağı ve uzanmakta haklı olduğu model.

/live-test sayfasında kendi prompt'larınızla günümüz alternatiflerinde çalıştırın. Aynı prompt, birden fazla model, yan yana.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Claude Sonnet 4.5 — illustration 2
Son otomatik test
15 Haz 2026 · 08:00 UTC · Hız testi
P50 gecikme
1483 ms
P95 gecikme
1487 ms
Hatalar
0 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·24 Mayıs 2026