Claude Opus 4.8 de Anthropic
Lanzado el 28 de mayo de 2026. Nuevo modelo insignia. 4× menos probable de dejar errores de código pasar.
Claude Opus 4.8 redefine qué significa un modelo insignia en producción: con una ventana de contexto de 1 millón de tokens y un sistema de autoevaluación significativamente más preciso, está diseñado para ejecuciones autónomas prolongadas donde la supervisión humana es esporádica.
— Análisis de modelo Tokonomix
Latencia medida en todas las ejecuciones de benchmark. P50 (mediana) y P95 (percentil 95) dan una imagen realista de la velocidad de respuesta bajo carga normal y máxima.
Resultados de evaluación de modelos juez en diversas categorías de tareas. Las puntuaciones reflejan coherencia, precisión y seguimiento de instrucciones.
Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.
Pricing over time
Input & output per 1M tokens · step-line = price changes
$5.00
input / 1M
— stable
$25.00
output / 1M
— stable
Rendimiento en tokens por segundo, derivado de la latencia P50 medida. Más alto es mejor; las fluctuaciones reflejan la carga del lado del proveedor.
Estimado a partir de latencia P50 × 200 tokens de salida — el número absoluto depende de esta suposición; lo que importa es la tendencia.
Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.
Para equipos que ya dependen de Opus 4.7, la actualización a Opus 4.8 es una decisión técnica clara: mayor fiabilidad en código, mayor autonomía, mismo coste. La única pregunta es si la latencia y el precio frente a Sonnet 4.6 se justifican según el caso de uso.
— Redacción Tokonomix
Claude Opus 4.8 expands significantly beyond its previous text-only baseline with the addition of vision, PDF input, tool use, JSON modes, reasoning capabilities, and prompt caching. These represent substantial functional enhancements to the model's utility across diverse workflows. The core academic performance established in the baseline appears maintained, though no new benchmark scores are available for this window to confirm performance trends. The additions of structured output formats through json_mode and json_schema address common integration needs, while tool support enables agentic workflows that were previously unavailable. Vision and PDF input capabilities extend the model's applicability to multimodal tasks. Prompt caching should improve efficiency for repetitive workflows with shared context. Users gain a notably more versatile model compared to the baseline, though the absence of updated performance metrics means stability of core capabilities cannot be verified. The breadth of new features positions this release as a major capability expansion rather than an incremental refinement.
Quality
—
Latency p50
—
Test runs
0
Lanzado el 28 de mayo de 2026. Nuevo modelo insignia. 4× menos probable de dejar errores de código pasar.
por Anthropic
Más de Anthropic
Modelos similares