İçeriğe geç
Seviye B — Üretim
Çalıştığı yer:USYapıldığı yer:United States
Anthropic

Claude Opus 4.7

Seviye B — Üretim · 1M token

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··

Claude Opus 4.7, Anthropic tarafından geliştirilen büyük bir dil modelidir ve şirketin Claude 4 serisinde en yüksek yetenek katmanını temsil eder. Opus varyantı olarak, karmaşık akıl yürütme görevleri, kapsamlı analizler ve gelişmiş doğal dil anlama ile üretim gerektiren uygulamalar için tasarlanmış, Anthropic'in en yetenekli modeli olarak konumlandırılmıştır. Model, 1 milyon token'lık bir bağlam penceresini destekleyerek önemli miktarda metin boyunca tutarlılığı koruyabilmektedir. Model; yazma, analiz, soru-cevap, kodlama desteği ve çok turlu sohbetler dahil olmak üzere standart metin üretim görevlerini yerine getirir. Genişletilmiş bağlam penceresi, onu uzun belgeleri, kapsamlı kod havuzlarını veya önemli geçmiş bağlam gerektiren sohbetleri içeren uygulamalar için uygun kılar. Claude Opus 4.7, model çıktılarında yardımseverlik, zararsızlık ve dürüstlüğü vurgulayan Anthropic'in anayasal yapay zeka eğitim metodolojisi üzerine inşa edilmiştir. Anthropic'in model yelpazesi içinde Opus, en üst performans katmanını temsil eder ve genellikle şirketin Sonnet ve Haiku varyantlarına kıyasla akıl yürütme, matematik, kodlama ve nüanslı dil görevlerinde daha güçlü yetenekler sunar. 4.7 sayısal adlandırması, modelin Anthropic'in iteratif model geliştirme sürecindeki konumunu belirterek Claude 4 nesli içindeki önceki sürümlere göre iyileştirmeleri yansıtır. Model, çıktı kalitesi ve gelişmiş akıl yürütmenin yanıt hızı veya hesaplama verimliliğinin önüne geçtiği kullanım senaryoları için tasarlanmıştır.

Anthropic'in güvenlik odaklı mimarisi, bu modeli karmaşık görevlerde güvenilir kılıyor.

Tokonomix benchmark özeti
Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme97 runs
147798515824236623150005-2206-15ms
Bölüm 02

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

100
Kod üretimi
99
Çok dilli
100
Akıl yürütme
Bölüm 03

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — Claude Opus 4.7
$5.00 1M giriş token başına
$25.00 1M çıkış token başına
≈ $0.0080 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$5.00
1M çıkış token başına$25.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$5.00

input / 1M

— stable

$25.00

output / 1M

— stable

2026-05-242026-05-312026-06-14
Input
Output
Price change
⟳ synced weekly
Bölüm 04

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)127 / avg 211
13425

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 05

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

1M token bağlam penceresiConstitutional AI güvenlik katmanıKarmaşık talimat takibiDerin analiz ve nüanslı çıktıUzun belge işleme kapasitesiMetin üretimi ve özetleme

Zayıf yönler

İnternet erişimi bulunmuyorGörsel işleme desteği yokBilgi kesim tarihi sonrası veri yok
Bölüm 06

Yetenekler

toolssource: litellmvisionjson modepdf inputreasoningjson schemaprompt cachingmax output tokens: 128000
Bölüm 07

Sık sorulan sorular

Metin üretimi, içerik oluşturma, soru-cevap ve özetleme görevlerini destekleyen geniş bir uygulama yelpazesi sunuyor.

Constitutional AI eğitim yöntemi zararlı çıktıları minimize eder ve uzun vadeli kullanım güvenliğini artırır.

Tokonomix benchmark özeti
Bölüm 08

Kullanılabilirlik

Kullanılabilirlik

Bu modelin çağrıldığında ne sıklıkla yanıt verdiği — son 30 gün içindeki gerçek API istekleri ve canlı testler üzerinden ölçülmüştür. Bu kaliteden bağımsızdır: bu sayılar yalnızca modelin yanıt verip vermediğini gösterir, yanıtın ne kadar iyi olduğunu değil.

Son 7 gün

100.0%

n=1

Son 30 gün

100.0%

n=1

Medyan yanıt süresi

40,367ms

n=1

Baz alınan 69 ölçüm son 30 gün içinde.

Teknik detaylar

Yalnızca gerçek API çağrıları ve canlı test istekleri sayılır — dahili yoklamalar ve kıyaslama çalıştırmaları hariçtir.

Özel API anahtarıyla (BYOK) yapılan çağrılar hariçtir: bu hatalar anahtara özgüdür, model kesintisinin işareti değildir.

Başarısız çağrılar kalite puanlarına DAHİL EDİLMEZ — kalite yalnızca başarılı yanıtlar üzerinden ölçülür. Kullanılabilirlik ve kalite bağımsız sinyallerdir.

Kaydedilmiş süreye sahip başarılı çağrılarda medyan yanıt süresi (p50). Aykırı değerler medyanı ortalamadan daha az etkiler.

Toplam çağrı (30d)

1

OK yanıtlar (30d)

1

Toplam çağrı (7d)

1

OK yanıtlar (7d)

1

Bölüm 09

Tokonomix kıyaslama kararları

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-596/100 · 76 runs
74 correct2 partial0 wrong97% accuracy
2026-06-14

Stability window with no benchmark data or capability changes detected

Claude Opus 4.7 enters this benchmark window with no new performance data available and no detected capability changes from the previous period. The model maintains its existing feature set including tools, vision, JSON mode, PDF input, reasoning, JSON schema, and prompt caching capabilities that were added in earlier updates. Without current benchmark results, it's not possible to assess performance trends, quality metrics, or comparative standing against other models in the field. Users should continue to rely on the previous benchmark window's findings for performance expectations. The absence of new data may indicate either a stable release period without updates or a gap in benchmark coverage. Organizations currently using Claude Opus 4.7 should not expect functional changes during this window. The model's established capabilities remain available, but performance characterization requires waiting for the next benchmark cycle with actual test results. Users evaluating this model should consult historical benchmark data and consider that real-world performance patterns may have shifted since the last measurement period.

Quality

Latency p50

Test runs

0

No benchmark data available Performance trends unknown
Bölüm 10

Tam model profili

Claude Opus 4.7 — illustration 1
Claude Opus 4.7: Anthropic'ten milyon token'lık akıl yürütücü

Claude Opus 4.7, Anthropic'in yığının en üstündeki en yeni modelidir. Bir milyon token'lık bağlam penceresiyle gelir ve Opus serisinin 4.x sürümünden beri taşıdığı aynı metin artı görsel giriş yüzeyine sahiptir. Fiyatlandırma bu sayfada herkese açık değil. Yetenek açık.

Opus 4.5 veya 4.6 ile herhangi bir zaman geçirdiyseniz, 4.7 güncellemesi farklı hissetmeden önce tanıdık gelecektir. Aynı ret stili, aynı çalışmasını gösterme sevgisi, istem belirsiz olduğunda ihtiyatlı yanıtlar için aynı tercih. Değişen şey çoğunlukla altta: bağlam penceresinin uzun ucunda daha iyi iğne-geri-alma, daha sıkı araç-çağrı biçimlendirmesi ve bazı incelemecilerin daha az çekingen olarak tanımladığı uzun biçimli yazıda biraz farklı bir ritim.

1M bağlamın size gerçekte kazandırdıkları

Bir milyon token, tam bir çeyreklik kazanç dosyası, orta ölçekli bir monorepo veya bir ekibin son on sekiz aylık Slack geçmişi için yeterlidir. Bu pazarlama cümlesi. Pratik soru, arka dolu olduğunda modelin hâlâ tamponun önüne dikkat edip etmediğidir.

Kendi geri-alma testlerimizde Opus 4.7, önceki neslin başlangıca yakın yerleştirilen gerçekleri unutmaya başladığı 200 bin işaret noktasının çok ötesinde iyi dayanıyor. Yaklaşık 600 bin token'ın ötesinde gecikmenin uzadığını görüyorsunuz — ilk token'a kadar geçen süre belirgin şekilde uzuyor ve akış token/saniye düşüyor. Ayrıntılı sayılar her döngüde değişiyor; canlı tablo /benchmarks/speed ve /benchmarks/intelligence adreslerinde yaşıyor.

İki pratik sonuç var. Birincisi, uzun pencere belge-arası durum tespiti ve tam-repo kod incelemesi gibi görevler için gerçekten kullanılabilir, sadece bir özellik-tablosu numarası değil. İkincisi, aynı büyük korpusa karşı tekrar sorgular için istem önbelleğe alma hakkında düşünmek yine de istiyorsunuz. API çağrısının kendisi temiz bir şekilde başarılı olduğunda bile her çağrıda 800 bin token bağlamı yeniden yüklemek duvar-saati zamanında pahalıdır.

Görsel giriş, uyarılarla birlikte

Opus 4.7 metinle birlikte görselleri kabul eder. Opus serisinin her zaman iyi olduğu şeylerde iyidir: gösterge panellerinin ekran görüntülerini okuma, sayfa görselleri olarak işlenmiş PDF'lerden tabloları çıkarma, diyagramları tanımlama. Eksen etiketlerinin küçücük olduğu yoğun grafiklerde daha az etkileyicidir ve elle yazılmış rakamları hâlâ yeterince sık yanlış okuyor ki ortada bir insan olmadan bir döngüye koymamalısınız.

Görsellerden çoğunlukla metin istediğiniz OCR ağırlıklı iş yükleri için, Claude veya Gemini ailesinden daha küçük bir görsel özellikli model genellikle maliyetin çok küçük bir kısmıyla işi halleder. Opus 4.7'yi, aynı zamanda modelin gördüğü şey hakkında akıl yürütmesine ihtiyaç duyduğunuz durumlar için saklayın.

Sahada nerede duruyor

Opus 4.7, yığının en üstünde GPT-5, GPT-5.1 ve Gemini 3 Pro Preview ile rekabet ediyor. Aralarından seçim yapmak tek bir eksende nadiren net bir kazanımdır.

Testlerimizde birkaç kalıp tutarlı şekilde ortaya çıkıyor. Opus 4.7, üçü arasında sınırda bir istemi doğrudan reddetme olasılığı en yüksek olanıdır, bu da bazı ekiplerin istediği ve diğerlerinin sinir bozucu bulduğu bir şeydir. Tek satırlık bir yanıt işe yarayacakken fazla açıklama yapma eğilimindedir. Ona bir JSON şeması verdiğiniz yapılandırılmış çıktı görevlerinde, şemayı önceki Claude sürümlerinin ara sıra eklediği halüsinasyonlu ekstra alan olmadan güvenilir şekilde takip eder. Çokdilli performans — özellikle Almanca, Fransızca ve Lehçe idari metinler arasında — Opus serisinin sessiz bir gücü olmuştur ve 4.7 bu konuda gerileme göstermiyor.

GPT-5.1 kısa konuşma turlarında hâlâ daha hızlı hissettiriyor. Gemini 3 Pro Preview önceki nesilden parite yakınındadır ancak uzun-bağlam dikkat kalıbı farklıdır — bazen gömülü tek bir gerçekte daha iyi performans gösterir ve birçok dağınık olana dair sentezde daha kötü.

Kategoriler arasında elmalar-elmalarla karşılaştırma için, dönen /benchmarks/leaderboard bakılacak yerdir. Puanlama metodolojisi ve veri seti seçimleri /benchmarks/methodology adresinde belgelenmiştir.

Nerede yanlış araçtır

Hızlı hareket eden framework'lere karşı kod üretimi. Opus 4.7 yetkin ama tutucu; codex-stili rakiplerin deyimsel kod yazdığı yerde güvenli, ayrıntılı kod yazar. Bir IDE'de otomatik tamamlama yapıyorsanız denetlenmiş çıktı üretmek yerine, fark önemlidir. Doğrudan karşılaştırmak için /usecases/code adresindeki model anketlerinden birini kullanın.

Gerçek zamanlı ses ve ses. Opus 4.7'nin ses girişi yok. Ses girişine ihtiyacınız varsa yukarı akışta bir transkripsiyon modeliyle eşleştirin veya boru hattının önü için ses ailesinden bir model seçin. Bu karar ağacı için /usecases/voice adresine bakın.

Düşük maliyetle yüksek hacimli sınıflandırma. Milyonlarca kısa istemi bir sınır modelinden geçirmek harcamanın yanlış şeklidir. Claude Haiku 4.5, Gemini 2.5 Flash veya OVH'de barındırılan daha küçük Llama veya Mistral modellerinden biri, basit görevlerde anlamlı bir kalite düşüşü olmadan bunu bütçenin çok küçük bir kısmıyla yapacaktır.

İnce ayar gerektiren her şey. Anthropic, Opus katmanında denetimli ince ayar sunmuyor. İş akışınız özel ağırlıklara ihtiyaç duyuyorsa — alan kelime dağarcığı, modelin kendisine kilitlenmiş marka sesi — açık ağırlıklı alternatiflere bakıyorsunuz, Opus'a değil.

Dağıtım notları

API doğrudandır. REST, akış desteklenir, sistem istemleri beklediğiniz şekilde davranır. Araç kullanım çağrıları temiz döner ve şema-uygulama, savunmacı ayrıştırma katmanı yazmadan üzerine ajanlar oluşturabilecek kadar sağlamdır.

Bölgesel kullanılabilirlik, Avrupa tedarik ekiplerini ısıran kısımdır. Anthropic'in çıkarımı Google Cloud ve AWS altyapısı üzerinde çalışır ve genel API bir bölge seçim parametresi açığa çıkarmaz. Kurumsal sözleşmeler ikamet maddelerini müzakere edebilir, ancak raflardaki API size garantili yalnızca AB çıkarım yolu vermez. Sert ikamet kısıtlamaları altındaki ekipler için, OVH'de barındırılan Llama 3.3 70B veya Mistral Small örneği tamamen farklı bir konuşmadır; bkz. /usecases/local.

Günlükler, kötüye kullanım izleme için varsayılan olarak otuz gün boyunca tutulur. API girişleri katılmadığınız sürece eğitim için kullanılmaz. Sıfır saklama mevcuttur ancak ayarlar düğmesi değil sözleşme müzakeresi gerektirir.

Onu seçmek

Claude Opus 4.7'yi şunlara ihtiyacınız olduğunda kullanın:

  • İpliği kaybetmeden çok uzun girişler boyunca dikkatlice akıl yürüten bir model.
  • Yapılandırılmış çıktıyı güvenilir şekilde üreten.
  • Avrupa dili idari ve hukuki metinleri terminolojiyi İngilizleştirmeden işleyen.
  • İstem yanıtı içermediğinde kendinden emin icat yerine varsayılan olarak "Emin değilim" diyen.

Gerçek zamanlı gecikmeye, çağrı başına sent-altı maliyete, yerel ses girişine veya kendi çevrenizde çalıştırabileceğiniz kendi kendine barındırılan ağırlığa ihtiyacınız olduğunda atlayın.

Dürüst özet: 4.7, zaten güçlü bir modelin iyileştirilmesidir, adım değişikliği değil. Üretimde zaten Opus 4.5 veya 4.6 kullanıyorsanız, uzun-bağlam iyileştirmeleri için geçiş yapmaya değer. Sıfırdan bir sınır modeli seçiyorsanız, kendi istemlerinizde GPT-5.1 ve Gemini 3 Pro Preview'e karşı çalıştırın — doğru seçim, herhangi bir tek kıyaslama numarasından çok modelden ne istediğinize bağlıdır.

Karşılaştırmayı kendiniz /live-test adresinde deneyin. Aynı istem, üç model, yan yana. Kayıt yok.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Claude Opus 4.7 — illustration 2Claude Opus 4.7 — illustration 3
Son otomatik test
15 Haz 2026 · 08:00 UTC · Hız testi
P50 gecikme
1574 ms
P95 gecikme
4882 ms
Hatalar
0 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·26 Mayıs 2026