Claude Opus 4.8 par Anthropic
Sorti le 28 mai 2026. Nouveau modèle phare. 4× moins susceptible de laisser passer des défauts de code par rapport à Opus 4.7. Même tarification, contexte 1M.
Opus 4.8 marque une étape concrète dans la fiabilité des agents autonomes : moins d'erreurs de code laissées passer, des exécutions plus longues sans dérive, et un contexte d'un million de tokens qui change la portée des tâches traitables en une seule passe. C'est le modèle phare d'Anthropic au 28 mai 2026, conçu pour les équipes qui confient à l'IA des missions complexes et de longue durée.
— Analyse modèle Tokonomix
Latence mesurée sur toutes les exécutions de benchmark. P50 (médiane) et P95 (95e percentile) donnent une image réaliste de la vitesse de réponse en charge normale et de pointe.
Résultats d'évaluation issus des notations du modèle juge sur diverses catégories de tâches. Les scores reflètent la cohérence, la précision et le suivi des instructions.
Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.
Pricing over time
Input & output per 1M tokens · step-line = price changes
$5.00
input / 1M
— stable
$25.00
output / 1M
— stable
Débit en tokens par seconde, dérivé de la latence P50 mesurée. Plus haut est mieux ; les fluctuations reflètent la charge côté fournisseur.
Estimé à partir de la latence P50 × 200 tokens de sortie — le chiffre absolu dépend de cette hypothèse ; c'est la tendance qui compte.
Basé sur les résultats de benchmarks et les retours communautaires agrégés sur des cas d'usage réels.
Opus 4.8 est le bon choix pour les flux de travail autonomes exigeants où la qualité du code et la durée d'exécution comptent davantage que la vitesse brute ou le coût par token. Pour les tâches courtes et répétitives, Sonnet 4.6 ou Haiku 4.5 restent plus économiques.
— Rédaction Tokonomix
Claude Opus 4.8 expands significantly beyond its previous text-only baseline with the addition of vision, PDF input, tool use, JSON modes, reasoning capabilities, and prompt caching. These represent substantial functional enhancements to the model's utility across diverse workflows. The core academic performance established in the baseline appears maintained, though no new benchmark scores are available for this window to confirm performance trends. The additions of structured output formats through json_mode and json_schema address common integration needs, while tool support enables agentic workflows that were previously unavailable. Vision and PDF input capabilities extend the model's applicability to multimodal tasks. Prompt caching should improve efficiency for repetitive workflows with shared context. Users gain a notably more versatile model compared to the baseline, though the absence of updated performance metrics means stability of core capabilities cannot be verified. The breadth of new features positions this release as a major capability expansion rather than an incremental refinement.
Quality
—
Latency p50
—
Test runs
0
Sorti le 28 mai 2026. Nouveau modèle phare. 4× moins susceptible de laisser passer des défauts de code par rapport à Opus 4.7. Même tarification, contexte 1M.
par Anthropic
Plus de Anthropic
Modèles similaires