article

Anthropic lanza Claude Fable 5 — y lideró nuestro piloto de visión-QC

Anthropic ha lanzado Claude Fable 5, un modelo de visión y razonamiento que también viene en una variante de contexto de un millón de tokens, claude-fable-5[1m]. Ya está disponible en la pasarela y el catálogo de Tokonomix, lo que significa que puedes enrutar hacia él y medirlo igual que cualquier otro modelo que listamos.

Lo pasamos por nuestras propias pruebas antes de escribir esto, así que el gancho no es una línea de prensa — es algo que medimos.

Lo que encontramos

En nuestro piloto de visión-QC del 9 de junio de 2026, Fable 5 fue el modelo de visión más estable que probamos. En el conjunto piloto fue idéntico el 88% de las veces, cambió de opinión solo el 3,9% y produjo cero falsos positivos — y detectó puntos ciegos que otros pasaron por alto. Esa estabilidad es la razón por la que lo convertimos en el proponente de visión por defecto de nuestro panel de consenso visual. (No está en nuestros grupos de jueces de texto — su tarea es mirar imágenes.)

Al día siguiente lo sometimos a una ejecución mayor, publicada en vivo en nuestro benchmark de visión-QC. Contra el conjunto de 300 imágenes mediaqc-v3-2026-06-10 el 10 de junio de 2026, Fable 5 en solitario obtuvo 66,9% de exhaustividad (mejor modelo individual, empatado), una tasa de falsas alarmas del 7,1% — muy por debajo de otros modelos de visión fuertes en la misma ejecución — y 60,3% de categoría correcta. Con Fable 5 en el panel de consenso, la exhaustividad subió al 87,5%.

La señal temprana sobre capacidad general es prometedora pero escasa: nuestra primera ejecución de inteligencia hoy devolvió una puntuación de razonamiento de 100 y una de código de 97 — una sola ejecución, n=1, así que trátalo como un primer dato, no un veredicto.

Dónde mirar a continuación

Lee el artículo completo en la página del modelo Claude Fable 5.
Mira las cifras en vivo en el benchmark de visión-QC.
Síguelo en distintas tareas en la clasificación.

Seguiremos midiendo a medida que crezca la muestra, y lo reportaremos como siempre — con las fechas y los tamaños de muestra.