200K token bağlam penceresi günlük kullanımda ne işe yarıyor?

Uzun belgeler, kapsamlı raporlar veya çok turlu konuşma geçmişini tek seansta işlemenize olanak tanıyor.

Anthropic modellerini diğer sağlayıcılardan ayıran temel özellik nedir?

Güvenlik odaklı Constitutional AI ve şeffaf politikalar.

Bu modeli üretimde kullanmadan önce nelere dikkat etmeli?

Hız, maliyet ve doğruluk açısından kendi kullanım senaryonuzu test edin; bağlam ve çıkarım maliyetleri kritik faktörlerdir.

Bu model ince ayar destekliyor mu?

Güncel API dokümantasyonunu kontrol etmeniz önerilir; destek sürüme göre değişebilir.

Seviye B — Üretim

Çalıştığı yer:USYapıldığı yer:United States

Anthropic

Claude Sonnet 4.5

Seviye B — Üretim · 200K token

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan·Yayınlandı 22 Mayıs 2026·Son inceleme 24 Mayıs 2026

Claude Sonnet 4.5, Anthropic tarafından geliştirilen ve Claude 3.5 model ailesinin bir parçası olarak yayımlanan bir büyük dil modelidir. Önceki Sonnet sürümleri üzerinde yinelemeli bir iyileştirmeyi temsil eder ve Anthropic'in ürün yelpazesindeki Sonnet katmanını niteleyen performans-verimlilik dengesini korur. Model; analiz, içerik üretimi, kodlama desteği ve sohbet etkileşimleri dahil olmak üzere genel amaçlı metin üretimi görevleri için tasarlanmıştır. Model, 200.000 token'lık bir bağlam penceresine sahiptir; bu sayede tek bir sohbet ya da belge analizi oturumunda önemli miktarda metni işleyebilir ve tutarlılığı koruyabilir. Claude Sonnet 4.5, standart metin tabanlı giriş ve çıkışları destekler; görüntü veya ses işleme için yerel çok modlu yetenekler sunmaz. Mimarisi; talimat takibini, olgusal doğruluğu ve yanıtlarda uygun sınırların korunmasını önceliklendirir. Anthropic'in model hiyerarşisinde Sonnet, daha hızlı ve uygun maliyetli Haiku modelleri ile daha yetkin ancak kaynak yoğun Opus katmanı arasında orta konumu işgal eder. Bu konumlandırma, Claude Sonnet 4.5'i amiral gemisi modellerin işlem yükü olmadan çeşitli görevlerde güvenilir performans gerektiren uygulamalar için uygun kılar. Modele Anthropic'in API'si ve seçili iş ortağı platformları üzerinden erişilebilir; müşteri hizmetleri otomasyonundan kurumsal ve bireysel geliştirici bağlamlarında yazılım geliştirme desteği ile belge analizine kadar uzanan kullanım senaryolarına hizmet eder.

Claude Sonnet 4.5 ile kendi sorularını test et

Anthropic'in güvenlik odaklı mimarisi, bu modeli karmaşık görevlerde güvenilir kılıyor.
— Tokonomix benchmark özeti

Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme101 runs

Bölüm 02

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

Yaratıcı

Olgusal

100

Çok dilli

100

Akıl yürütme

Bölüm 03

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰

API tarifeleri — Claude Sonnet 4.5

$3.00 1M giriş token başına

$15.00 1M çıkış token başına

≈ $0.0048 tipik konuşma başına (800 token)

Giriş vs çıkış fiyatı (1M token başına)

1M giriş token başına$3.00

1M çıkış token başına$15.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$3.00

input / 1M

— stable

$15.00

output / 1M

— stable

2026-05-242026-06-282026-07-26

Input

Output

Price change

⟳ synced weekly

Bölüm 04

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)50 / avg 125

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 05

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

200K token uzun bağlamConstitutional AI güvenlik katmanıKarmaşık talimat takibiPerformans ve hız dengesiÜretim ortamı güvenilirliğiMetin üretimi ve özetleme

Zayıf yönler

İnternet erişimi bulunmuyorGörsel işleme desteği yokBilgi kesim tarihi sonrası veri yok

Bölüm 06

Yetenekler

toolssource: litellmvisionjson modepdf inputreasoningjson schemaprompt cachingmax output tokens: 64000

Bölüm 07

Sık sorulan sorular

Metin üretimi, içerik oluşturma, soru-cevap ve özetleme görevlerini destekleyen geniş bir uygulama yelpazesi sunuyor.

Constitutional AI eğitim yöntemi zararlı çıktıları minimize eder ve uzun vadeli kullanım güvenliğini artırır.
— Tokonomix benchmark özeti

Bölüm 08

Kullanılabilirlik

Henüz ölçüm verisi yok

Bu model için kullanılabilirlik istatistiklerini göstermek için yeterli API çağrısı henüz kaydedilmedi. Veri, model canlı trafik almaya başlayınca görünür.

Bölüm 09

Tokonomix kıyaslama kararları

⚖️

Endorsed by 2 judges

Independent LLM judges evaluated this model on our weekly intelligence tests

cohere/command-a100/100 · 1 runs

1 correct0 partial0 wrong100% accuracy

claude-sonnet-4-596/100 · 116 runs

113 correct3 partial0 wrong97% accuracy

● 2026-07-26

Quality decline driven by significant factual performance regression

Claude Sonnet 4.5 experienced a notable 8.9 point drop in overall quality, falling from 97.0 to 88.1. This decline is primarily attributed to a substantial regression in factual accuracy, which scored just 57 compared to the model's previously strong performance across all categories. The factual score represents a significant weakness that users should carefully consider for knowledge-intensive applications. Despite this setback, the model demonstrates exceptional performance in several areas. Multilingual capabilities remain outstanding at 100, showing slight improvement over the previous 99. Reasoning tasks also achieved a perfect 100 score, indicating strong logical and analytical abilities. Creative performance improved to 96 from 92, suggesting enhanced generative capabilities. Latency showed marginal improvement, with p50 dropping from 6567ms to 6125ms, providing faster response times. However, it's worth noting that the benchmark categories shifted between windows, with coding performance no longer separately reported in the current evaluation period. Users should weigh the model's strengths in reasoning, multilingual support, and creative tasks against the concerning factual accuracy regression. Applications requiring reliable factual knowledge may need additional verification layers until this performance gap is addressed.

Quality

88.1

Latency p50

6,125 ms

Test runs

✗ Quality dropped 8.9 points✗ Factual accuracy fell to 57✓ Perfect reasoning and multilingual scores✓ Latency improved by 442ms

Bölüm 10

Tam model profili

Claude Sonnet 4.5: hakkını kazanan prodüksiyon orta katmanı

Claude Sonnet 4.5 (claude-sonnet-4-5-20250929), Eylül 2025 sonu Sonnet anlık görüntüsüdür. İki yüz bin token context window. Metin ve görüntü girişi. En geniş prodüksiyon Claude dağıtım kitlesinin sonunda kullandığı orta katman model.

Bu anlık görüntüye en uygun çerçeveleme: Sonnet 4.5, Opus'a bakıp akıl yürütme kalitesinin gerçekte ihtiyaç duyduklarından fazla olduğuna karar veren ve Haiku'ya bakıp derinliğin istediklerinden az olduğuna karar veren ekiplerin uzandığı model. Ortada, kasıtlı olarak ve ortayı iyi yapacak şekilde oturuyor.

Bu anlık görüntünün tutunmasının nedeni

4.5'te aynı anda inen birkaç şey, Sonnet 4.0 üzerinde çalışan ekipler için varsayılan yükseltme hedefine dönüştürdü:

Daha temiz JSON şema uyumu. Önceki Sonnet anlık görüntüleri, karmaşık iç içe şemalarda zaman zaman alan adlarında sapıyordu. 4.5, sözleşmeyi güvenilir biçimde tutuyor.
Daha sıkı reddetme tutumu. Model, önceki Sonnet anlık görüntülerinin gösterdiği biraz farklı tutum yerine Opus ile aynı akıl yürütme tarzıyla sınır prompt'larını reddediyor.
Daha tahmin edilebilir system-prompt işleme. System prompt ile kullanıcı prompt çakıştığında, 4.5 birini sessizce önceliklendirmek yerine ikisini de tartar.
Daha iyi uzun biçimli çıktı bütünlüğü. Çok paragraflı yanıtlar, önceki Sonnet anlık görüntülerinin zaman zaman sürüklendiği kendini tekrarlama olmaksızın bir arada duruyor.

Bunların hiçbiri benchmark başlığı değil. Tümü, on bin istek başına arızaları sayarken ajan döngüsü veya yapılandırılmış çıkarım hattı çalıştırdığınızda önem taşıyor.

200k pencere ne kazandırıyor

İki yüz bin token, ciddi bir kod tabanı, uzun bir çeyreklik rapor veya çok belgeli bir titizlik klasörü için yeterli. Sonnet 4.5, tamponun büyük bölümünde makul biçimde dikkatini koruyor; olağan uyarıyla: çok uzun girişlerin ortasında iğne bulma kalitesi bir miktar düşüyor.

İş yükünüz düzenli olarak 150k token girişini aşıyorsa iki pratik seçenek var. 4.5 üzerinde kalın ve modeli context'e bağlı tutmak için prompt mühendisliği kalıpları kullanın — soruyu context sonunda tekrarlayın, girişi net bölüm başlıklarıyla yapılandırın. Ya da derinlikte anlamlı ölçüde daha iyi dikkatle milyon token penceresi sunan Sonnet 4.6'ya geçin. Güncel gecikme tablosu /benchmarks/speed sayfasında.

İşini yapan görüntü girişi

4.5'teki görüntü yetenekleri standart belge okuma görevleri için çalışıyor. Ekran görüntüleri, sayfa görseli olarak işlenmiş taranmış PDF'ler, pano yakaları, diyagramlar. Tablo çıkarımı temiz. Makul etiket boyutlu grafikler doğru biçimde tanımlanıyor.

El yazısı zayıf nokta. Küçük etiketli yoğun bilimsel şekiller de öyle. Kaynağı okumak için yakınlaştırmak gereken her şey, döngüde insan doğrulama adımından yararlanıyor.

Görüntü yığını 4.x serisi genelinde paylaşılıyor. Sonnet 4.5'i Opus 4.5 veya Haiku 4.5 ile özellikle görüntü için değerlendiriyorsanız, katmana göre olağan kalite gradiyanıyla benzer davranış bekleyin.

Sahada ne durumda

2026 ortasında Sonnet 4.5 için dürüst rekabet tablosu:

Daha yeni Anthropic Sonnet anlık görüntülerine karşı: Sonnet 4.6 doğal yükseltme hedefi. Aynı giriş yüzeyini taşıyor; artı milyon token context penceresi ve tool-use cilasına yönelik artımlı iyileştirmeler. 200k token içine sığan iş yükleri için tercih büyük ölçüde yetenek değil operasyonel kararla belirleniyor.

GPT-5 orta katman ve Gemini 2.5 Pro'ya karşı: Sonnet 4.5, kategoriye göre dönüşümlü zaferler paylaşıyor. Reddetme tutarlılığı, Avrupalı dillerde idari düzyazı, yapılandırılmış çıktı güvenilirliğinde kazanıyor. Kısa konuşmalı durumlarda ham hız ve görüntülerin ötesinde yerel çok modalite girişinde kaybediyor.

Yan yana karşılaştırma için /benchmarks/leaderboard süregelen tabloyu güncel tutuyor ve kategori puanları /benchmarks/intelligence sayfasında ayrışıyor.

Yanlış araç olduğu durumlar

Yüksek hacimli ucuz sınıflandırma. Milyonlarca kısa prompt göndermek için orta katman hesaplama yanlış bütçe kullanımı. Claude Haiku 4.5 veya Gemini 2.5 Flash bunu, basit görevlerde anlamlı kalite kaybı olmaksızın farklı bir maliyet katmanında yapıyor.

Gerçek zamanlı ses. Sonnet 4.5'in audio girişi yok. /usecases/voice sayfasındaki ses hattı kılavuzu doğru mimariyi kapsıyor.

Gerçekten üst yığın akıl yürütme gerektiren iş yükleri. Göreviniz çok adımlı biçimsel akıl yürütme, büyük kod tabanlarında karmaşık yeniden düzenleme veya birçok belge genelinde dikkatli sentez içeriyorsa, Opus katmanı doğru tercih. Sonnet 4.5 iyi; Opus bu özel durumlar için daha iyi.

Deyimsel çıktı istediğiniz hızlı gelişen framework'lerde kod üretimi. Model yeterli ama muhafazakâr. IDE uyumlu çalışmalar için /usecases/code sayfasındaki anket seçenekleri karşılaştırıyor.

Kendi kendinize barındırma veya ince ayar. Anthropic ağırlık dağıtmıyor ve Sonnet katmanında denetimli ince ayar sunmuyor. Bu kısıtlamalar için açık ağırlıklı seçenekler /usecases/local sayfasında inceleniyor.

Dağıtım notları

Standart Anthropic API. REST. Streaming. System prompt'lar tahmin edilebilir davranıyor. Tool-use çağrı kalitesi, savunmacı parsing yazmaksızın prodüksiyon ajanı inşa etmeye yetecek kadar yüksek.

Veri yerleşimi tablosu, Claude serisinin geri kalanıyla aynı. Inference AWS ve Google Cloud üzerinde çalışıyor; public API bölge seçim parametresi sunmuyor. AB yerleşimi bir ayar değil, kurumsal sözleşme müzakeresi gerektiriyor. Zorunlu yerleşim kısıtlamaları için OVH-hosted alternatiflere bakın.

Günlükler varsayılan olarak kötüye kullanım izleme için otuz gün saklanıyor. Girişler opt-in olmadıkça eğitimde kullanılmıyor. Sıfır saklama kurumsal sözleşme maddesi.

Tercih kriteri

Claude Sonnet 4.5'e şu durumlarda uzanın:

En güncel yerine en prodüksiyona hazır Sonnet anlık görüntüsünü istediğinizde.
İş yükü 200k token context içine sığıyorsa.
Yapılandırılmış çıktı güvenilirliği ve reddetme tutarlılığı tasarımınız için önemliyse.
Terminoloji sadakatinin önemli olduğu Avrupalı dillerde idari veya hukuki metin işliyorsanız.

Başka bir şey seçin:

Düzenli olarak 200k tokenden fazla context gerekiyorsa. Sonnet 4.6'ya geçin.
Amiral gemisi seviyesinde akıl yürütme gerekiyorsa. Opus'a çıkın.
Çağrı başı alt-sent maliyet gerekiyorsa. Haiku'ya inin.
Audio, ses veya video iş yükunun parçasıysa.

Özet. Sonnet 4.5, prodüksiyon için güvenli orta katman seçim. Daha yeni anlık görüntüler öncü cephede daha yetenekli, ama 4.5 çoğu ekibin uzanacağı ve uzanmakta haklı olduğu model.

/live-test sayfasında kendi prompt'larınızla günümüz alternatiflerinde çalıştırın. Aynı prompt, birden fazla model, yan yana.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Son otomatik test

30 Tem 2026 · 08:05 UTC · Hız testi

P50 gecikme

4022 ms

P95 gecikme

8369 ms

Hatalar

0 / 6 çalıştırma

Son inceleyen Tokonomix Ekibi·24 Mayıs 2026