article

Anthropic Claude Fable 5’i çıkardı — ve görsel-QC pilotumuzun başına geçti

Anthropic, bir milyon token bağlam çeşidiyle de gelen bir görü-ve-akıl yürütme modeli olan Claude Fable 5’i yayımladı: claude-fable-5[1m]. Artık Tokonomix ağ geçidi ve kataloğunda canlı; yani ona yönlendirebilir ve listelediğimiz her model gibi ölçebilirsiniz.

Bunu yazmadan önce kendi testlerimizden geçirdik, dolayısıyla buradaki çıpa bir basın cümlesi değil — ölçtüğümüz bir şey.

Ne bulduk

9 Haziran 2026 görsel-QC pilotumuzda Fable 5, test ettiğimiz en istikrarlı görü modeliydi. Pilot kümede zamanın %88’inde çalışma-özdeşti, yalnızca %3,9 fikir değiştirdi ve sıfır yanlış pozitif üretti — ayrıca başkalarının kaçırdığı kör noktaları yakaladı. Bu istikrar, onu görsel konsensüs panelimizde varsayılan görü öneren model yapmamızın nedeni. (Metin-yargıç havuzlarımızda değil — görevi görsellere bakmak.)

Ertesi gün onu daha büyük bir koşumdan geçirdik ve sonucu görsel-QC kıyaslamamızda canlı yayımladık. 10 Haziran 2026’da 300 görsellik mediaqc-v3-2026-06-10 veri kümesine karşı Fable 5 tek başına %66,9 duyarlılık (en iyi tekil modelle başa baş), %7,1 yanlış-alarm oranı — aynı koşumdaki diğer güçlü görü modellerinin epey altında — ve %60,3 sınıf-uyumu aldı. Fable 5 konsensüs panelinde yer aldığında duyarlılık %87,5’e yükseldi.

Genel yetenek konusundaki erken sinyal umut verici ama zayıf: bugünkü ilk zeka koşumumuz akıl yürütme 100 ve kod 97 döndürdü — tek koşum, n=1, dolayısıyla bir hüküm değil ilk veri noktası olarak değerlendirin.

Sırada nereye bakmalı

Tam yazıyı Claude Fable 5 model sayfasında okuyun.
Canlı rakamları görsel-QC kıyaslamasında görün.
Görevler boyunca sıralamada izleyin.

Örneklem büyüdükçe ölçmeye devam edeceğiz ve her zamanki gibi raporlayacağız — tarih ve örneklem büyüklükleriyle birlikte.