İçeriğe geç
Seviye A — Öncü
Çalıştığı yer:USYapıldığı yer:United States
Anthropic

Claude Haiku 4.5

Seviye A — Öncü · 200K token

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··

Claude Haiku 4.5, Anthropic tarafından geliştirilen ve Claude model ailesi içinde hızlı ve verimli bir seçenek olarak konumlandırılan bir dil modelidir. Serinin daha büyük modellerine kıyasla daha düşük gecikme süresiyle standart metin üretme görevlerini ele alacak şekilde tasarlanmıştır; bu da onu yanıt hızının öncelik olduğu uygulamalar için uygun kılar. Model, 200.000 token'lık bir bağlam penceresini destekleyerek tek bir etkileşimde önemli miktarda metni işleyip referans almasına olanak tanır. Bu model, Anthropic'in Claude Sonnet veya Claude Opus gibi daha yetenekli modellerinin hesaplama yükü olmadan hızlı çıkarım gerektiren kullanım senaryolarına hizmet etmek üzere geliştirilmiştir. Tipik uygulamalar arasında hızlı geri dönüşün gerekli olduğu müşteri destek otomasyonu, içerik denetimi, veri çıkarımı ve gerçek zamanlı sohbet botu uygulamaları yer alır. Akıl yürütme, talimat takibi ve doğal dil anlama konusundaki temel yetkinliklerini korurken, Anthropic'in model hiyerarşisi içinde performans ile hız arasında bir denge sunar. Claude Haiku 4.5, Anthropic'in katmanlı model yapısında verimliliğe odaklanan seçenek olarak yer alır ve akıl yürütme derinliği ile görev karmaşıklığını yönetme açısından Claude Sonnet ile Claude Opus'un altında konumlanır. Claude 3.5 nesline ait diğer modellerle aynı genişletilmiş bağlam penceresini paylaşır ve bu sayede seri genelinde tutarlı belge işleme kapasitesi sağlar. Model, Anthropic'in API'si üzerinden erişilebilir olup üretim ortamlarında minimum gecikmeyle güvenilir metin üretimine ihtiyaç duyan geliştiriciler için tasarlanmıştır.

Anthropic'in güvenlik odaklı mimarisi, bu modeli karmaşık görevlerde güvenilir kılıyor.

Tokonomix benchmark özeti
Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme97 runs
152115021483145414305-2206-15ms
Bölüm 02

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

100
Kod üretimi
99
Çok dilli
100
Akıl yürütme
Bölüm 03

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — Claude Haiku 4.5
$1.00 1M giriş token başına
$5.00 1M çıkış token başına
≈ $0.0016 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$1.00
1M çıkış token başına$5.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.00

input / 1M

▲ +25% since first

$5.00

output / 1M

▲ +25% since first

2026-05-242026-05-312026-06-14
Input
Output
Price change
⟳ synced weekly
Bölüm 04

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)338 / avg 298
130284

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 05

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

Düşük gecikme, hızlı yanıt200K token uzun bağlamConstitutional AI güvenlik katmanıKarmaşık talimat takibiMetin üretimi ve özetlemeÇok turlu sohbet desteği

Zayıf yönler

İnternet erişimi bulunmuyorGörsel işleme desteği yokBilgi kesim tarihi sonrası veri yok
Bölüm 06

Yetenekler

toolssource: litellmvisionjson modepdf inputreasoningjson schemaprompt cachingmax output tokens: 64000
Bölüm 07

Sık sorulan sorular

Metin üretimi, içerik oluşturma, soru-cevap ve özetleme görevlerini destekleyen geniş bir uygulama yelpazesi sunuyor.

Constitutional AI eğitim yöntemi zararlı çıktıları minimize eder ve uzun vadeli kullanım güvenliğini artırır.

Tokonomix benchmark özeti
Bölüm 08

Kullanılabilirlik

Kullanılabilirlik

Bu modelin çağrıldığında ne sıklıkla yanıt verdiği — son 30 gün içindeki gerçek API istekleri ve canlı testler üzerinden ölçülmüştür. Bu kaliteden bağımsızdır: bu sayılar yalnızca modelin yanıt verip vermediğini gösterir, yanıtın ne kadar iyi olduğunu değil.

Son 7 gün

100.0%

n=21

Son 30 gün

100.0%

n=21

Medyan yanıt süresi

1,912ms

n=21

Baz alınan 109 ölçüm son 30 gün içinde.

Teknik detaylar

Yalnızca gerçek API çağrıları ve canlı test istekleri sayılır — dahili yoklamalar ve kıyaslama çalıştırmaları hariçtir.

Özel API anahtarıyla (BYOK) yapılan çağrılar hariçtir: bu hatalar anahtara özgüdür, model kesintisinin işareti değildir.

Başarısız çağrılar kalite puanlarına DAHİL EDİLMEZ — kalite yalnızca başarılı yanıtlar üzerinden ölçülür. Kullanılabilirlik ve kalite bağımsız sinyallerdir.

Kaydedilmiş süreye sahip başarılı çağrılarda medyan yanıt süresi (p50). Aykırı değerler medyanı ortalamadan daha az etkiler.

Toplam çağrı (30d)

21

OK yanıtlar (30d)

21

Toplam çağrı (7d)

21

OK yanıtlar (7d)

21

Bölüm 09

Tokonomix kıyaslama kararları

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-592/100 · 76 runs
66 correct8 partial2 wrong87% accuracy
2026-06-14

Claude Haiku 4.5: Major Quality Leap with Increased Latency Trade-off

Claude Haiku 4.5 demonstrates a substantial quality improvement in the current window, jumping 6.7 points to reach an exceptional 99.6 overall score. The model has achieved perfect 100-point scores in both coding and reasoning categories, representing significant gains over the previous window's coding performance and marking the emergence of reasoning as a tracked capability. Multilingual performance remains strong at 99, down just one point from the previous perfect score. However, this quality enhancement comes with a notable performance cost: median latency has increased by 26 percent, rising from 2998ms to 3763ms. This suggests Anthropic may have prioritized capability improvements over speed optimization in this iteration. The shift in tracked categories is noteworthy, with creative and factual assessments absent from current results while reasoning now appears as a measured dimension. Users can expect substantially improved code generation and logical reasoning capabilities, but should account for longer response times in latency-sensitive applications. The near-perfect overall score positions this model among the highest-performing options available, though the speed regression may impact real-time use cases.

Quality

99.6

Latency p50

3,763 ms

Test runs

5

Quality improved 6.7 points Perfect coding and reasoning scores Latency increased 26% Response time now 3763ms
Bölüm 10

Tam model profili

Claude Haiku 4.5 — illustration 1
Claude Haiku 4.5: Anthropic'in küçük modeli, ciddiye alınmış

Claude Haiku 4.5 (claude-haiku-4-5-20251001), mevcut Anthropic serisinin kompakt üyesidir. İki yüz bin token context window, metin ve görüntü girişi desteği. Kullanıcı karşısında yavaş yanıt özrü bekletmeyecek türden bir gecikme profili.

Anthropic, Haiku'yu eskiden "açık ara ikinci seçenek" yapan şeyleri sessiz sedasız gideriyor. Önceki Haiku seviyesi, prompt konusu chat dışına biraz kayınca kırılgan hale gelirdi. 4.5, bu garip aralık işlerde çok daha sağlam duruyor — karmaşık bir faturadan alan çıkarmak, iki örtüşen niyetle gelen destek talebini sınıflandırmak, uzun bir yazışmayı müşterinin asıl sorusunu kaybetmeden özetlemek. Opus değil. Olmaya da çalışmıyor.

Hızın satın aldığı şey

Burada önemli olan sayı ilk token'a süre. Haiku 4.5, kısa prompt'larda neredeyse anında akış başlatıyor ve giriş, context penceresinin sonuna doğru büyüdükçe de bu yanıt verme hızını koruyor. Güncel rakamlar /benchmarks/speed sayfasında — Anthropic altyapıyı haftadan haftaya ince ayarladığça değişiyor, ama Haiku tutarlı biçimde ölçtüğümüz en hızlı API-hosted metin+görüntü modellerinden biri olmayı sürdürüyor.

Bu gecikme profili, neyin inşa edilebileceğini değiştiriyor. Gerçek zamanlı konuşma ajanları, yanıtı kısa tutmak için zorlu prompt mühendisliği olmaksızın hayata geçirilebilir hale geliyor. Akış RAG yanıtları, alınan veri 50k token'ı aşsa bile anlık hissettiriyor. Opus'ta yarım saat sürecek toplu sınıflandırma işleri dakikalar içinde bitiyor. Birinci kademe küçük modelin maliyeti çoğu zaman yalnızca token başı ücret satırından ibaret değildir — hayata geçirmeyi sağladığı mimari sadeleşmelerdir asıl kazanç.

İşe yarar görüntü girişi

Haiku 4.5, 4.x serisinin geri kalanından gelen görüntü yığınını devraldı. Ekran görüntüsü, taranmış belge, form fotoğrafı, diyagram verebilirsiniz. OCR ağırlıklı işlerde — pano okuma, makbuzlardan kalemleri çıkarma, yazılı sayfaları aktarma — büyük modele yükselmene nadiren gerek bırakacak kadar başarılı sonuç üretiyor.

El yazısı hâlâ zayıf nokta. Küçük eksen etiketli grafikler ve yoğun bilimsel şekiller de öyle. Eğer belge küçük boyutta bir insana bile zor geliyorsa Haiku da zorlanır. Güvenlik açısından kritik her şey için araya insan denetimi ekleyin.

Serideki yeri

Dürüst çerçeveleme: Haiku 4.5, aynı iş yükleri için Gemini 2.5 Flash, Gemini 2.5 Flash-Lite ve OpenAI'nin küçük GPT-5 varyantlarıyla rekabet ediyor. Aralarındaki tercih nadiren tek bir benchmark üzerinden karara bağlanır.

Haiku 4.5'in öne çıktığı durumlar:

  • Yapılandırılmış çıktı güvenilirliği. JSON schema verin, şemaya bağlı kalsın. Önceki Claude küçük modeller zaman zaman ekstra alan üretiyordu. Bu sorun giderilmiş görünüyor.
  • Reddetme tutumu. Sınırda prompt'ları Opus gibi, aynı görünür gerekçeyle reddediyor. Uygulamanız model seviyeleri arasında tutarlı güvenlik çiti davranışından yararlanıyorsa Haiku 4.5 uyum sağlıyor.
  • Avrupalı dillerde idari yazım. Almanca, Fransızca, Hollandaca, Lehçe — Opus serisi bu alanda her zaman güçlüydü ve Haiku mirası devraldı. Hukuki deyimde kusursuz değil, ama bazı rakip küçük modellerin yaptığı gibi terminolojiyi İngilizceye çevirmiyor.

Geri kaldığı durumlar:

  • Ham token başı fiyat. Bazı rakip küçük modeller fiyat listesinde daha aşağıda yer alıyor. Ölçeklerde maliyet odaklı toplu işler için rakamları kendiniz yan yana koyun.
  • Çok uzun prompt'larda gecikme. Yaklaşık 150k giriş tokenini geçince ilk token süresi uzuyor. Gemini 2.5 Flash, penceresinin uzun ucunda zaman zaman daha hızlı akış yapıyor.

Yan yana karşılaştırma için /benchmarks/leaderboard süregelen tabloyu güncel tutuyor. Kategori puanları /benchmarks/intelligence sayfasında ayrıştırılıyor.

Yanlış araç olduğu durumlar

Derin çok adımlı akıl yürütme gerektiren her şey. Haiku 4.5 düşünce zincirlerinde kötü değil, ama Opus'un sergilediği öz-denetim sabrına sahip değil. Görevi kendi ara adımlarını doğrulamayı içeriyorsa bir üst seviyeye geçin.

Tanıdık olmayan kod tabanlarında kod üretimi. Makul kod yazıyor, ama hızlı gelişen framework'lerde ön uçlar için Sonnet ya da Opus daha deyimsel çıktı üretiyor. IDE uyumu için /usecases/code kılavuzuna bakın.

Ses ve audio. Haiku 4.5'in audio girişi yok. Konuşmalı arayüz gerekiyorsa önüne bir transkripsiyon modeli koyun. Karar ağacı /usecases/voice sayfasında.

İnsan denetimi olmaksızın güvenlik kritik her şey. Model iyi hizalanmış ve düşünceli reddediyor; ama bu seviyede tıbbi, hukuki ya da finansal tavsiyeyi gözetimsiz beslemek doğru değil. Bu tüm küçük modeller için geçerli, yalnızca bu model için değil.

Dağıtım notları

REST API. Streaming çalışıyor. System prompt'lar tahmin edilebilir davranıyor. Tool-use çağrıları her yanıtın etrafına savunmacı parser yazmak zorunda kalmaksızın ajan döngüsü inşa edebilecek kadar güvenilir.

Bölgesel kullanılabilirlik, Claude serisinin geri kalanıyla aynı Anthropic kalıbını izliyor — inference AWS ve Google Cloud altyapısı üzerinde çalışıyor ve public API bölge sabitlemeye izin vermiyor. Zorunlu veri yerleşimi kısıtlaması altındaki AB ekipleri kurumsal sözleşme müzakeresi yapmalı ya da OVH veya Scaleway'de barındırılan bir alternatife yönelmeli. Yerleşim zorunluluğu tartışılmaz olduğunda açık ağırlıklı seçenekler için /usecases/local kılavuzuna bakın.

Günlükler varsayılan olarak kötüye kullanım izleme için otuz gün saklanıyor. Girişler opt-in olmadıkça eğitimde kullanılmıyor. Sıfır saklama bir sözleşme müzakeresi meselesi; bir ayar değil.

Tercih kriteri

Claude Haiku 4.5'e şu durumlarda uzanın:

  • Gecikme, kalite kadar önemli olduğunda.
  • Maliyetin ve sürenin küçük bir bölümüyle Opus ile aynı reddetme davranışını ve yapılandırılmış çıktı güvenilirliğini istediğinizde.
  • Akıl yürütme derinliğinin darboğaz olmadığı yüksek hacimli RAG, sınıflandırma veya konuşmalı işler yaptığınızda.
  • Tam çözünürlükte okunabilir belgelerde görüntü girişine ihtiyacınız olduğunda.

Şu durumlarda atlayın:

  • Görev sürekli çok adımlı akıl yürütme gerektiriyorsa. Sonnet ya da Opus'a geçin.
  • Ses girişi veya çıkışı gerekiyorsa. Tamamen yanlış aile.
  • Maliyet her şeyden önemliyse ve zayıflamış yapılandırılmış çıktı güvenilirliğini tolere edebiliyorsanız — bazı rakipler daha düşük fiyatlıyor.
  • Şirket içi dağıtım gerekiyorsa. Anthropic ağırlık dağıtmıyor.

Özet: Haiku 4.5, kendini ciddiye alan küçük bir model. Özellikle Sonnet ya da Opus gerektirmeyen her şey için doğru varsayılan seçim; yanlış tercih edilse bile bunun bedeli eskisi kadar ağır değil.

Alternatifleriyle karşılaştırmak için /live-test sayfasını deneyin. Aynı prompt, birden fazla model, yan yana.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Claude Haiku 4.5 — illustration 2
Son otomatik test
15 Haz 2026 · 08:00 UTC · Hız testi
P50 gecikme
591 ms
P95 gecikme
731 ms
Hatalar
0 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·24 Mayıs 2026