200K token bağlam penceresi günlük kullanımda ne işe yarıyor?

Uzun belgeler, kapsamlı raporlar veya çok turlu konuşma geçmişini tek seansta işlemenize olanak tanıyor.

Anthropic modellerini diğer sağlayıcılardan ayıran temel özellik nedir?

Güvenlik odaklı Constitutional AI ve şeffaf politikalar.

Bu modeli üretimde kullanmadan önce nelere dikkat etmeli?

Hız, maliyet ve doğruluk açısından kendi kullanım senaryonuzu test edin; bağlam ve çıkarım maliyetleri kritik faktörlerdir.

Bu model ince ayar destekliyor mu?

Güncel API dokümantasyonunu kontrol etmeniz önerilir; destek sürüme göre değişebilir.

Seviye A — Öncü

Çalıştığı yer:USYapıldığı yer:United States

Anthropic

Claude Haiku 4.5

Seviye A — Öncü · 200K token

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan·Yayınlandı 22 Mayıs 2026·Son inceleme 24 Mayıs 2026

Claude Haiku 4.5, Anthropic tarafından geliştirilen ve Claude model ailesi içinde hızlı ve verimli bir seçenek olarak konumlandırılan bir dil modelidir. Serinin daha büyük modellerine kıyasla daha düşük gecikme süresiyle standart metin üretme görevlerini ele alacak şekilde tasarlanmıştır; bu da onu yanıt hızının öncelik olduğu uygulamalar için uygun kılar. Model, 200.000 token'lık bir bağlam penceresini destekleyerek tek bir etkileşimde önemli miktarda metni işleyip referans almasına olanak tanır. Bu model, Anthropic'in Claude Sonnet veya Claude Opus gibi daha yetenekli modellerinin hesaplama yükü olmadan hızlı çıkarım gerektiren kullanım senaryolarına hizmet etmek üzere geliştirilmiştir. Tipik uygulamalar arasında hızlı geri dönüşün gerekli olduğu müşteri destek otomasyonu, içerik denetimi, veri çıkarımı ve gerçek zamanlı sohbet botu uygulamaları yer alır. Akıl yürütme, talimat takibi ve doğal dil anlama konusundaki temel yetkinliklerini korurken, Anthropic'in model hiyerarşisi içinde performans ile hız arasında bir denge sunar. Claude Haiku 4.5, Anthropic'in katmanlı model yapısında verimliliğe odaklanan seçenek olarak yer alır ve akıl yürütme derinliği ile görev karmaşıklığını yönetme açısından Claude Sonnet ile Claude Opus'un altında konumlanır. Claude 3.5 nesline ait diğer modellerle aynı genişletilmiş bağlam penceresini paylaşır ve bu sayede seri genelinde tutarlı belge işleme kapasitesi sağlar. Model, Anthropic'in API'si üzerinden erişilebilir olup üretim ortamlarında minimum gecikmeyle güvenilir metin üretimine ihtiyaç duyan geliştiriciler için tasarlanmıştır.

Claude Haiku 4.5 ile kendi sorularını test et

Anthropic'in güvenlik odaklı mimarisi, bu modeli karmaşık görevlerde güvenilir kılıyor.
— Tokonomix benchmark özeti

Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme101 runs

Bölüm 02

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

Yaratıcı

Olgusal

100

Çok dilli

100

Akıl yürütme

Bölüm 03

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰

API tarifeleri — Claude Haiku 4.5

$1.00 1M giriş token başına

$5.00 1M çıkış token başına

≈ $0.0016 tipik konuşma başına (800 token)

Giriş vs çıkış fiyatı (1M token başına)

1M giriş token başına$1.00

1M çıkış token başına$5.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.00

input / 1M

— stable

$5.00

output / 1M

— stable

2026-05-242026-06-282026-07-26

Input

Output

Price change

⟳ synced weekly

Bölüm 04

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)263 / avg 266

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 05

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

Düşük gecikme, hızlı yanıt200K token uzun bağlamConstitutional AI güvenlik katmanıKarmaşık talimat takibiMetin üretimi ve özetlemeÇok turlu sohbet desteği

Zayıf yönler

İnternet erişimi bulunmuyorGörsel işleme desteği yokBilgi kesim tarihi sonrası veri yok

Bölüm 06

Yetenekler

toolssource: litellmvisionjson modepdf inputreasoningjson schemaprompt cachingmax output tokens: 64000

Bölüm 07

Sık sorulan sorular

Metin üretimi, içerik oluşturma, soru-cevap ve özetleme görevlerini destekleyen geniş bir uygulama yelpazesi sunuyor.

Constitutional AI eğitim yöntemi zararlı çıktıları minimize eder ve uzun vadeli kullanım güvenliğini artırır.
— Tokonomix benchmark özeti

Bölüm 08

Kullanılabilirlik

Bu modelin çağrıldığında ne sıklıkla yanıt verdiği — son 30 gün içindeki gerçek API istekleri ve canlı testler üzerinden ölçülmüştür. Bu kaliteden bağımsızdır: bu sayılar yalnızca modelin yanıt verip vermediğini gösterir, yanıtın ne kadar iyi olduğunu değil.

Son 7 gün

100.0%

n=17

Son 30 gün

100.0%

n=510

Medyan yanıt süresi

6,474ms

n=510

Baz alınan 890 ölçüm son 30 gün içinde.

Teknik detaylar

Yalnızca gerçek API çağrıları ve canlı test istekleri sayılır — dahili yoklamalar ve kıyaslama çalıştırmaları hariçtir.

Özel API anahtarıyla (BYOK) yapılan çağrılar hariçtir: bu hatalar anahtara özgüdür, model kesintisinin işareti değildir.

Başarısız çağrılar kalite puanlarına DAHİL EDİLMEZ — kalite yalnızca başarılı yanıtlar üzerinden ölçülür. Kullanılabilirlik ve kalite bağımsız sinyallerdir.

Kaydedilmiş süreye sahip başarılı çağrılarda medyan yanıt süresi (p50). Aykırı değerler medyanı ortalamadan daha az etkiler.

Toplam çağrı (30d)

510

OK yanıtlar (30d)

510

Toplam çağrı (7d)

OK yanıtlar (7d)

Bölüm 09

Tokonomix kıyaslama kararları

⚖️

Endorsed by 2 judges

Independent LLM judges evaluated this model on our weekly intelligence tests

cohere/command-a100/100 · 1 runs

1 correct0 partial0 wrong100% accuracy

claude-sonnet-4-593/100 · 116 runs

103 correct9 partial4 wrong89% accuracy

● 2026-07-26

Claude Haiku 4.5: Speed Gains Offset by Quality Regression

Claude Haiku 4.5 shows a notable 38% latency improvement, dropping from 4596ms to 2855ms median response time, making it significantly faster for production use cases. However, this performance gain comes alongside a concerning 3.2-point decrease in overall quality score, falling from 97.7 to 94.5. The model continues to excel in reasoning and multilingual tasks, both scoring perfect hundreds, with multilingual performance slightly improving from 98. Creative output remains strong at 96, up marginally from 95. The most significant concern is the absence of coding scores in the current window despite previous perfect performance, suggesting either test coverage changes or potential capability regression in this domain. Factual accuracy shows at 82, representing a new measurement category. The model maintains exceptional performance in core capabilities while delivering substantially faster responses, but users relying on coding tasks should exercise caution until this capability is re-verified. The quality-speed tradeoff appears deliberate, positioning this version for latency-sensitive applications where the modest quality decrease is acceptable.

Quality

94.5

Latency p50

2,855 ms

Test runs

✓ 38% faster response time✗ 3.2-point quality decrease✓ Perfect reasoning and multilingual scores✗ Coding performance not measured

Bölüm 10

Tam model profili

Claude Haiku 4.5: Anthropic'in küçük modeli, ciddiye alınmış

Claude Haiku 4.5 (claude-haiku-4-5-20251001), mevcut Anthropic serisinin kompakt üyesidir. İki yüz bin token context window, metin ve görüntü girişi desteği. Kullanıcı karşısında yavaş yanıt özrü bekletmeyecek türden bir gecikme profili.

Anthropic, Haiku'yu eskiden "açık ara ikinci seçenek" yapan şeyleri sessiz sedasız gideriyor. Önceki Haiku seviyesi, prompt konusu chat dışına biraz kayınca kırılgan hale gelirdi. 4.5, bu garip aralık işlerde çok daha sağlam duruyor — karmaşık bir faturadan alan çıkarmak, iki örtüşen niyetle gelen destek talebini sınıflandırmak, uzun bir yazışmayı müşterinin asıl sorusunu kaybetmeden özetlemek. Opus değil. Olmaya da çalışmıyor.

Hızın satın aldığı şey

Burada önemli olan sayı ilk token'a süre. Haiku 4.5, kısa prompt'larda neredeyse anında akış başlatıyor ve giriş, context penceresinin sonuna doğru büyüdükçe de bu yanıt verme hızını koruyor. Güncel rakamlar /benchmarks/speed sayfasında — Anthropic altyapıyı haftadan haftaya ince ayarladığça değişiyor, ama Haiku tutarlı biçimde ölçtüğümüz en hızlı API-hosted metin+görüntü modellerinden biri olmayı sürdürüyor.

Bu gecikme profili, neyin inşa edilebileceğini değiştiriyor. Gerçek zamanlı konuşma ajanları, yanıtı kısa tutmak için zorlu prompt mühendisliği olmaksızın hayata geçirilebilir hale geliyor. Akış RAG yanıtları, alınan veri 50k token'ı aşsa bile anlık hissettiriyor. Opus'ta yarım saat sürecek toplu sınıflandırma işleri dakikalar içinde bitiyor. Birinci kademe küçük modelin maliyeti çoğu zaman yalnızca token başı ücret satırından ibaret değildir — hayata geçirmeyi sağladığı mimari sadeleşmelerdir asıl kazanç.

İşe yarar görüntü girişi

Haiku 4.5, 4.x serisinin geri kalanından gelen görüntü yığınını devraldı. Ekran görüntüsü, taranmış belge, form fotoğrafı, diyagram verebilirsiniz. OCR ağırlıklı işlerde — pano okuma, makbuzlardan kalemleri çıkarma, yazılı sayfaları aktarma — büyük modele yükselmene nadiren gerek bırakacak kadar başarılı sonuç üretiyor.

El yazısı hâlâ zayıf nokta. Küçük eksen etiketli grafikler ve yoğun bilimsel şekiller de öyle. Eğer belge küçük boyutta bir insana bile zor geliyorsa Haiku da zorlanır. Güvenlik açısından kritik her şey için araya insan denetimi ekleyin.

Serideki yeri

Dürüst çerçeveleme: Haiku 4.5, aynı iş yükleri için Gemini 2.5 Flash, Gemini 2.5 Flash-Lite ve OpenAI'nin küçük GPT-5 varyantlarıyla rekabet ediyor. Aralarındaki tercih nadiren tek bir benchmark üzerinden karara bağlanır.

Haiku 4.5'in öne çıktığı durumlar:

Yapılandırılmış çıktı güvenilirliği. JSON schema verin, şemaya bağlı kalsın. Önceki Claude küçük modeller zaman zaman ekstra alan üretiyordu. Bu sorun giderilmiş görünüyor.
Reddetme tutumu. Sınırda prompt'ları Opus gibi, aynı görünür gerekçeyle reddediyor. Uygulamanız model seviyeleri arasında tutarlı güvenlik çiti davranışından yararlanıyorsa Haiku 4.5 uyum sağlıyor.
Avrupalı dillerde idari yazım. Almanca, Fransızca, Hollandaca, Lehçe — Opus serisi bu alanda her zaman güçlüydü ve Haiku mirası devraldı. Hukuki deyimde kusursuz değil, ama bazı rakip küçük modellerin yaptığı gibi terminolojiyi İngilizceye çevirmiyor.

Geri kaldığı durumlar:

Ham token başı fiyat. Bazı rakip küçük modeller fiyat listesinde daha aşağıda yer alıyor. Ölçeklerde maliyet odaklı toplu işler için rakamları kendiniz yan yana koyun.
Çok uzun prompt'larda gecikme. Yaklaşık 150k giriş tokenini geçince ilk token süresi uzuyor. Gemini 2.5 Flash, penceresinin uzun ucunda zaman zaman daha hızlı akış yapıyor.

Yan yana karşılaştırma için /benchmarks/leaderboard süregelen tabloyu güncel tutuyor. Kategori puanları /benchmarks/intelligence sayfasında ayrıştırılıyor.

Yanlış araç olduğu durumlar

Derin çok adımlı akıl yürütme gerektiren her şey. Haiku 4.5 düşünce zincirlerinde kötü değil, ama Opus'un sergilediği öz-denetim sabrına sahip değil. Görevi kendi ara adımlarını doğrulamayı içeriyorsa bir üst seviyeye geçin.

Tanıdık olmayan kod tabanlarında kod üretimi. Makul kod yazıyor, ama hızlı gelişen framework'lerde ön uçlar için Sonnet ya da Opus daha deyimsel çıktı üretiyor. IDE uyumu için /usecases/code kılavuzuna bakın.

Ses ve audio. Haiku 4.5'in audio girişi yok. Konuşmalı arayüz gerekiyorsa önüne bir transkripsiyon modeli koyun. Karar ağacı /usecases/voice sayfasında.

İnsan denetimi olmaksızın güvenlik kritik her şey. Model iyi hizalanmış ve düşünceli reddediyor; ama bu seviyede tıbbi, hukuki ya da finansal tavsiyeyi gözetimsiz beslemek doğru değil. Bu tüm küçük modeller için geçerli, yalnızca bu model için değil.

Dağıtım notları

REST API. Streaming çalışıyor. System prompt'lar tahmin edilebilir davranıyor. Tool-use çağrıları her yanıtın etrafına savunmacı parser yazmak zorunda kalmaksızın ajan döngüsü inşa edebilecek kadar güvenilir.

Bölgesel kullanılabilirlik, Claude serisinin geri kalanıyla aynı Anthropic kalıbını izliyor — inference AWS ve Google Cloud altyapısı üzerinde çalışıyor ve public API bölge sabitlemeye izin vermiyor. Zorunlu veri yerleşimi kısıtlaması altındaki AB ekipleri kurumsal sözleşme müzakeresi yapmalı ya da OVH veya Scaleway'de barındırılan bir alternatife yönelmeli. Yerleşim zorunluluğu tartışılmaz olduğunda açık ağırlıklı seçenekler için /usecases/local kılavuzuna bakın.

Günlükler varsayılan olarak kötüye kullanım izleme için otuz gün saklanıyor. Girişler opt-in olmadıkça eğitimde kullanılmıyor. Sıfır saklama bir sözleşme müzakeresi meselesi; bir ayar değil.

Tercih kriteri

Claude Haiku 4.5'e şu durumlarda uzanın:

Gecikme, kalite kadar önemli olduğunda.
Maliyetin ve sürenin küçük bir bölümüyle Opus ile aynı reddetme davranışını ve yapılandırılmış çıktı güvenilirliğini istediğinizde.
Akıl yürütme derinliğinin darboğaz olmadığı yüksek hacimli RAG, sınıflandırma veya konuşmalı işler yaptığınızda.
Tam çözünürlükte okunabilir belgelerde görüntü girişine ihtiyacınız olduğunda.

Şu durumlarda atlayın:

Görev sürekli çok adımlı akıl yürütme gerektiriyorsa. Sonnet ya da Opus'a geçin.
Ses girişi veya çıkışı gerekiyorsa. Tamamen yanlış aile.
Maliyet her şeyden önemliyse ve zayıflamış yapılandırılmış çıktı güvenilirliğini tolere edebiliyorsanız — bazı rakipler daha düşük fiyatlıyor.
Şirket içi dağıtım gerekiyorsa. Anthropic ağırlık dağıtmıyor.

Özet: Haiku 4.5, kendini ciddiye alan küçük bir model. Özellikle Sonnet ya da Opus gerektirmeyen her şey için doğru varsayılan seçim; yanlış tercih edilse bile bunun bedeli eskisi kadar ağır değil.

Alternatifleriyle karşılaştırmak için /live-test sayfasını deneyin. Aynı prompt, birden fazla model, yan yana.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Son otomatik test

30 Tem 2026 · 08:06 UTC · Hız testi

P50 gecikme

761 ms

P95 gecikme

1895 ms

Hatalar

0 / 6 çalıştırma

Son inceleyen Tokonomix Ekibi·24 Mayıs 2026