Aller au contenu

article

Anthropic lance Claude Fable 5 — et il a dominé notre pilote vision-QC

Anthropic lance Claude Fable 5 — et il a dominé notre pilote vision-QC

Anthropic a publié Claude Fable 5, un modèle vision-et-raisonnement qui existe aussi en variante contexte d'un million de tokens, claude-fable-5[1m]. Il est désormais disponible dans la passerelle et le catalogue Tokonomix : vous pouvez y router et le mesurer comme tout autre modèle que nous listons.

Nous l'avons passé par nos propres tests avant d'écrire ceci — l'accroche n'est donc pas une ligne de presse, mais quelque chose que nous avons mesuré.

Ce que nous avons trouvé

Dans notre pilote vision-QC du 9 juin 2026, Fable 5 était le modèle vision le plus stable que nous ayons testé. Sur le jeu pilote, il était identique à 88% d'un passage à l'autre, ne changeait d'avis que dans 3,9% des cas et produisait zéro faux positif — et il a détecté des angles morts manqués par d'autres. Cette stabilité explique pourquoi nous en avons fait le proposeur vision par défaut de notre panel de consensus visuel. (Il n'est pas dans nos pools de juges de texte — son rôle est de regarder des images.)

Le lendemain, nous l'avons soumis à un run plus grand, publié en direct sur notre benchmark vision-QC. Face au jeu de 300 images mediaqc-v3-2026-06-10 le 10 juin 2026, Fable 5 en solo a obtenu 66,9% de rappel (meilleur modèle individuel, à égalité), un taux de fausses alertes de 7,1% — bien en dessous d'autres modèles vision solides du même run — et 60,3% de catégorie correcte. Avec Fable 5 dans le panel de consensus, le rappel est monté à 87,5%.

Le signal précoce sur la capacité générale est prometteur mais mince : notre premier run d'intelligence aujourd'hui a renvoyé un score de raisonnement de 100 et un score de code de 97 — un seul run, n=1, donc à traiter comme un premier point de données, pas un verdict.

Où regarder ensuite

Nous continuerons à mesurer à mesure que l'échantillon grandit, et nous le rapporterons comme toujours — avec les dates et les tailles d'échantillon.

Anthropic lance Claude Fable 5 — et il a dominé notre pilote vision-QC · Tokonomix