Ir al contenido
Tier A — Frontera
Se ejecuta en:USCreado en:United States
Anthropic

Claude Opus 4.8

Tier A — Frontera · 1M tokens

Equipo editorial Tokonomix·Revisado por Mes Kalkan·

Claude Opus 4.8 redefine qué significa un modelo insignia en producción: con una ventana de contexto de 1 millón de tokens y un sistema de autoevaluación significativamente más preciso, está diseñado para ejecuciones autónomas prolongadas donde la supervisión humana es esporádica.

Análisis de modelo Tokonomix
Sección 01

Análisis de velocidad

Latencia medida en todas las ejecuciones de benchmark. P50 (mediana) y P95 (percentil 95) dan una imagen realista de la velocidad de respuesta bajo carga normal y máxima.

Latencia P50 (mediana)Latencia P9548 runs
687839016094237973150005-2906-09ms
Sección 02

Puntuaciones de calidad

Resultados de evaluación de modelos juez en diversas categorías de tareas. Las puntuaciones reflejan coherencia, precisión y seguimiento de instrucciones.

97
Generación de código
100
Creativo
95
Factual
100
Multilingüe
Sección 03

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰
Tarifas API — Claude Opus 4.8
$5.00 por 1M de tokens de entrada
$25.00 por 1M de tokens de salida
≈ $0.0080 por conversación típica (800 tokens)
Precio entrada vs salida (por 1M de tokens)
por 1M de tokens de entrada$5.00
por 1M de tokens de salida$25.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$5.00

input / 1M

— stable

$25.00

output / 1M

— stable

2026-05-312026-06-072026-06-07
Input
Output
Price change
⟳ synced weekly
Sección 04

Tokens por segundo

Rendimiento en tokens por segundo, derivado de la latencia P50 medida. Más alto es mejor; las fluctuaciones reflejan la carga del lado del proveedor.

Rendimiento (tokens / s)230 / avg 198
28842

Estimado a partir de latencia P50 × 200 tokens de salida — el número absoluto depende de esta suposición; lo que importa es la tendencia.

Sección 05

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

4× menos errores de código pasados por altoAutoevaluación del progreso significativamente más precisaEjecuciones autónomas más largas sin intervenciónContexto de 1 millón de tokensSoporte nativo de visión e imágenesTool-use avanzado para pipelines de agentesAdaptive thinking integrado sin configuración adicional

Debilidades

Coste elevado frente a Sonnet 4.6 y Haiku 4.5Mayor latencia que modelos más ligeros en tareas simplesFecha de corte de conocimiento limita datos recientesSin modo extended thinking (no disponible en 4.8)
Sección 06

Capacidades

toolssource: litellmvisionjson modepdf inputreasoningjson schemaprompt cachingmax output tokens: 128000
Sección 07

Preguntas frecuentes

En la mayoría de los casos, sí. El precio de entrada/salida es idéntico al de Opus 4.7, por lo que no hay coste incremental. La mejora clave —aproximadamente 4× menos probabilidad de dejar pasar errores de código— se traduce directamente en menos revisiones manuales y ciclos de corrección en pipelines automatizados.

Para equipos que ya dependen de Opus 4.7, la actualización a Opus 4.8 es una decisión técnica clara: mayor fiabilidad en código, mayor autonomía, mismo coste. La única pregunta es si la latencia y el precio frente a Sonnet 4.6 se justifican según el caso de uso.

Redacción Tokonomix
Sección 08

Veredictos del benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-598/100 · 5 runs
5 correct0 partial0 wrong100% accuracy
2026-06-07

Claude Opus 4.8 adds multimodal and tooling capabilities to baseline

Claude Opus 4.8 expands significantly beyond its previous text-only baseline with the addition of vision, PDF input, tool use, JSON modes, reasoning capabilities, and prompt caching. These represent substantial functional enhancements to the model's utility across diverse workflows. The core academic performance established in the baseline appears maintained, though no new benchmark scores are available for this window to confirm performance trends. The additions of structured output formats through json_mode and json_schema address common integration needs, while tool support enables agentic workflows that were previously unavailable. Vision and PDF input capabilities extend the model's applicability to multimodal tasks. Prompt caching should improve efficiency for repetitive workflows with shared context. Users gain a notably more versatile model compared to the baseline, though the absence of updated performance metrics means stability of core capabilities cannot be verified. The breadth of new features positions this release as a major capability expansion rather than an incremental refinement.

Quality

Latency p50

Test runs

0

Vision and PDF support added Tool use capability introduced JSON output modes available Prompt caching efficiency feature
Sección 09

Perfil completo del modelo

Claude Opus 4.8 de Anthropic

Lanzado el 28 de mayo de 2026. Nuevo modelo insignia. 4× menos probable de dejar errores de código pasar.

Última prueba automática
9 jun 2026 · 20:03 UTC · Benchmark de velocidad
Latencia P50
870 ms
Latencia P95
964 ms
Errores
0 / 6 ejecuciones
Última revisión por Equipo Tokonomix·29 de mayo de 2026