İçeriğe geç
Seviye A — Öncü
Çalıştığı yer:USYapıldığı yer:United States
Anthropic

Claude Opus 4.8

Seviye A — Öncü · 1M token

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan·

Claude Opus 4.8, Anthropic'in otonom yazılım geliştirme ve karmaşık çok adımlı görevler için tasarladığı amiral gemisi modelidir. Opus 4.7 üzerine inşa edilmiş ancak kod doğruluğu ve öz-değerlendirme kapasitesi açısından belirgin biçimde ileriye taşınmıştır.

Tokonomix model analizi
Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme48 runs
687839016094237973150005-2906-09ms
Bölüm 02

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

97
Kod üretimi
100
Yaratıcı
95
Olgusal
100
Çok dilli
Bölüm 03

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — Claude Opus 4.8
$5.00 1M giriş token başına
$25.00 1M çıkış token başına
≈ $0.0080 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$5.00
1M çıkış token başına$25.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$5.00

input / 1M

— stable

$25.00

output / 1M

— stable

2026-05-312026-06-072026-06-07
Input
Output
Price change
⟳ synced weekly
Bölüm 04

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)230 / avg 198
28842

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 05

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

Kod hatalarını 4× daha az atlamaKeskin öz-değerlendirme kapasitesiUzun otonom çalışmalar desteği1.000.000 token bağlam penceresiMetin ve görüntü girdi desteğiGelişmiş tool-use ve ajan orkestrasyonAdaptive thinking modu

Zayıf yönler

Sonnet ve Haiku'ya göre yüksek maliyetHafif modellere kıyasla daha yüksek gecikmeBilgi kesim tarihinden sonraki olayları bilmezExtended thinking modu bulunmuyor
Bölüm 06

Yetenekler

toolssource: litellmvisionjson modepdf inputreasoningjson schemaprompt cachingmax output tokens: 128000
Bölüm 07

Sık sorulan sorular

Hayır. Opus 4.8, API düzeyinde Opus 4.7 ile birebir uyumludur ve aynı giriş/çıkış fiyatlandırmasını kullanır. Model adını güncellemek yeterlidir; başka bir entegrasyon değişikliği gerekmez.

Kod doğruluğu ve uzun süreli otonom yürütme kritik önceliklerse Opus 4.8, Anthropic portföyünün en güçlü seçeneğidir; bütçe veya gecikme kısıtı varsa Sonnet 4.6 değerlendirilebilir.

Tokonomix editöryel ekibi
Bölüm 08

Tokonomix kıyaslama kararları

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-598/100 · 5 runs
5 correct0 partial0 wrong100% accuracy
2026-06-07

Claude Opus 4.8 adds multimodal and tooling capabilities to baseline

Claude Opus 4.8 expands significantly beyond its previous text-only baseline with the addition of vision, PDF input, tool use, JSON modes, reasoning capabilities, and prompt caching. These represent substantial functional enhancements to the model's utility across diverse workflows. The core academic performance established in the baseline appears maintained, though no new benchmark scores are available for this window to confirm performance trends. The additions of structured output formats through json_mode and json_schema address common integration needs, while tool support enables agentic workflows that were previously unavailable. Vision and PDF input capabilities extend the model's applicability to multimodal tasks. Prompt caching should improve efficiency for repetitive workflows with shared context. Users gain a notably more versatile model compared to the baseline, though the absence of updated performance metrics means stability of core capabilities cannot be verified. The breadth of new features positions this release as a major capability expansion rather than an incremental refinement.

Quality

Latency p50

Test runs

0

Vision and PDF support added Tool use capability introduced JSON output modes available Prompt caching efficiency feature
Bölüm 09

Tam model profili

Anthropic Claude Opus 4.8

28 Mayıs 2026 yayımlandı. Yeni amiral gemisi model. Kod hatalarının gözden kaçma olasılığı 4× daha düşük.

Son otomatik test
9 Haz 2026 · 20:03 UTC · Hız testi
P50 gecikme
870 ms
P95 gecikme
964 ms
Hatalar
0 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·29 Mayıs 2026