Naar inhoud

article

Anthropic lanceert Claude Fable 5 — en het won onze vision-QC-pilot

Anthropic lanceert Claude Fable 5 — en het won onze vision-QC-pilot

Anthropic heeft Claude Fable 5 uitgebracht, een vision-en-redeneermodel dat ook in een variant van één miljoen tokens context komt: claude-fable-5[1m]. Het staat nu live in de Tokonomix-gateway en -catalogus, dus je kunt ernaartoe routeren en het meten zoals elk ander model dat we vermelden.

We hebben het door onze eigen tests gehaald voordat we dit schreven, dus de haak hier is geen persregel — het is iets dat we maten.

Wat we vonden

In onze vision-QC-pilot op 9 juni 2026 was Fable 5 het stabielste vision-model dat we testten. Op de pilotset was het 88% van de tijd run-identiek, veranderde maar 3,9% van de tijd van mening en leverde nul fout-positieven — en het ving blinde vlekken die andere modellen misten. Die stabiliteit is waarom we het de standaard vision-proposer maakten in ons image-consensuspanel. (Het zit niet in onze text-judge-pools — zijn taak is naar beelden kijken.)

De dag erna lieten we het een grotere run draaien, live gepubliceerd op onze vision-QC-benchmark. Tegen de dataset mediaqc-v3-2026-06-10 van 300 beelden op 10 juni 2026 scoorde Fable 5 solo 66,9% recall (gedeeld beste solo-model), een vals-alarmpercentage van 7,1% — ruim onder andere sterke vision-modellen in dezelfde run — en 60,3% klasse-correct. Met Fable 5 in het consensuspanel steeg de recall naar 87,5%.

Het vroege signaal over algemene capaciteit is veelbelovend maar dun: onze eerste intelligentie-run vandaag gaf een redeneerscore van 100 en een codeerscore van 97 — één run, n=1, dus behandel het als een eerste datapunt, geen oordeel.

Waar je verder kijkt

We blijven meten terwijl de steekproef groeit, en we rapporteren het zoals altijd — mét de datums en steekproefgroottes erbij.