Zum Inhalt
Tier A — Frontier
Läuft in:USErstellt in:United States
Anthropic

Claude Opus 4.8

Tier A — Frontier · 1M Tokens

Tokonomix-Redaktionsteam·Geprüft von Mes Kalkan·

Claude Opus 4.8 setzt Anthropics Flaggschiff-Linie fort und liefert messbar zuverlässigere Code-Analyse sowie deutlich längere autonome Läufe — bei identischen Preisen wie Opus 4.7.

Tokonomix Modellanalyse
Abschnitt 01

Geschwindigkeitsanalyse

Latenz über alle Benchmark-Läufe gemessen. P50 (Median) und P95 (95. Perzentil) zeigen ein realistisches Bild der Antwortgeschwindigkeit bei normaler und Spitzenlast.

P50-Latenz (Median)P95-Latenz48 runs
687839016094237973150005-2906-09ms
Abschnitt 02

Qualitätswerte

Auswertungsergebnisse aus Judge-Model-Bewertungen über verschiedene Aufgabenkategorien. Werte spiegeln Kohärenz, Genauigkeit und Anweisungsbefolgung wider.

97
Codegenerierung
100
Kreativ
95
Faktisch
100
Mehrsprachig
Abschnitt 03

Preisverlauf

Direkte Provider-Tarife pro Million Tokens, plus eine typische Gesprächskostenschätzung.

💰
API-Tarife — Claude Opus 4.8
$5.00 pro 1M Input-Tokens
$25.00 pro 1M Output-Tokens
≈ $0.0080 pro typischem Gespräch (800 Tokens)
Input- vs. Output-Preis (pro 1M Tokens)
pro 1M Input-Tokens$5.00
pro 1M Output-Tokens$25.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$5.00

input / 1M

— stable

$25.00

output / 1M

— stable

2026-05-312026-06-072026-06-07
Input
Output
Price change
⟳ synced weekly
Abschnitt 04

Tokens pro Sekunde

Durchsatz in Tokens pro Sekunde, abgeleitet aus gemessener P50-Latenz. Höhere Werte sind besser; Schwankungen spiegeln die Provider-seitige Last wider.

Durchsatz (Tokens / s)230 / avg 198
28842

Geschätzt aus P50-Latenz × 200 Output-Tokens — die absolute Zahl hängt von dieser Annahme ab; entscheidend ist der Trend.

Abschnitt 05

Stärken & Schwächen

Basierend auf Benchmark-Ergebnissen und aggregiertem Community-Feedback zu realen Anwendungsfällen.

Stärken

4× weniger übersehene Code-FehlerLängere autonome Läufe ohne Abbruch1 Million Token KontextfensterAdaptive Thinking für schwierige AufgabenSchärferes Urteil über eigenen FortschrittVision und multimodale EingabenZuverlässiges Tool-Use in Agenten-PipelinesGleicher Preis wie Opus 4.7

Schwächen

Höhere Latenz als Sonnet 4.6 oder Haiku 4.5Deutlich teurer als leichtere Modelle für einfache AufgabenKein Extended-Thinking-Modus verfügbarKnowledge-Cutoff schränkt tagesaktuelle Informationen ein
Abschnitt 06

Fähigkeiten

toolssource: litellmvisionjson modepdf inputreasoningjson schemaprompt cachingmax output tokens: 128000
Abschnitt 07

Häufig gestellte Fragen

Ja, wenn Code-Review oder autonome Agenten-Workflows im Einsatz sind. Die rund 4× geringere Rate übersehener Code-Fehler und die verbesserte Selbstbeurteilung des Fortschritts reduzieren manuelle Nachkontrolle spürbar. Für rein textbasierte Aufgaben ohne Fehlerkritikalität ist der Unterschied geringer.

Für Teams, die komplexe, mehrstufige Workflows automatisieren wollen, ist Opus 4.8 derzeit die robusteste Wahl im Anthropic-Portfolio — sofern Latenz und Kosten im Verhältnis zum Aufgabengewicht stehen.

Tokonomix Redaktion
Abschnitt 08

Tokonomix-Benchmark-Urteile

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-598/100 · 5 runs
5 correct0 partial0 wrong100% accuracy
2026-06-07

Claude Opus 4.8 adds multimodal and tooling capabilities to baseline

Claude Opus 4.8 expands significantly beyond its previous text-only baseline with the addition of vision, PDF input, tool use, JSON modes, reasoning capabilities, and prompt caching. These represent substantial functional enhancements to the model's utility across diverse workflows. The core academic performance established in the baseline appears maintained, though no new benchmark scores are available for this window to confirm performance trends. The additions of structured output formats through json_mode and json_schema address common integration needs, while tool support enables agentic workflows that were previously unavailable. Vision and PDF input capabilities extend the model's applicability to multimodal tasks. Prompt caching should improve efficiency for repetitive workflows with shared context. Users gain a notably more versatile model compared to the baseline, though the absence of updated performance metrics means stability of core capabilities cannot be verified. The breadth of new features positions this release as a major capability expansion rather than an incremental refinement.

Quality

Latency p50

Test runs

0

Vision and PDF support added Tool use capability introduced JSON output modes available Prompt caching efficiency feature
Abschnitt 09

Vollständiges Modellprofil

Claude Opus 4.8 von Anthropic

Veröffentlicht am 28. Mai 2026. Anthropics neues Flaggschiff. Gegenüber Opus 4.7: rund 4× geringere Wahrscheinlichkeit für übersehene Code-Fehler, schärferes Urteilsvermögen über den eigenen Fortschritt, längere autonome Läufe. Identische Ein-/Ausgabepreise wie 4.7 ($5/$25 pro 1M Tokens), 1M-Token-Kontextfenster, adaptive Thinking, kein Extended-Thinking-Modus.

Vollständiger redaktioneller Text folgt — Seite befüllt aus offiziellen Anthropic-Release-Daten am 29. Mai 2026.

Letzter automatisierter Test
9. Juni 2026 · 20:03 UTC · Geschwindigkeits-Benchmark
P50-Latenz
870 ms
P95-Latenz
964 ms
Fehler
0 / 6 Läufe
Zuletzt geprüft von Tokonomix-Team·29. Mai 2026