Zum Inhalt
Tier B — Produktion
Läuft in:USErstellt in:United States
Anthropic

Claude Sonnet 4.5

Tier B — Produktion · 200K Tokens

Tokonomix-Redaktionsteam·Geprüft von Mes Kalkan··

Claude Sonnet 4.5 ist ein von Anthropic entwickeltes großes Sprachmodell, das als Teil der Claude 3.5 Modellfamilie veröffentlicht wurde. Es stellt eine iterative Weiterentwicklung früherer Sonnet-Versionen dar und behält das für die Sonnet-Stufe in Anthropics Produktpalette charakteristische Gleichgewicht zwischen Leistung und Effizienz bei. Das Modell ist für allgemeine Textgenerierungsaufgaben konzipiert, darunter Analyse, Content-Erstellung, Programmierhilfe und dialogorientierte Interaktionen. Das Modell verfügt über ein Kontextfenster von 200.000 Token, wodurch es umfangreiche Textmengen in einer einzelnen Konversation oder Dokumentenanalyse verarbeiten und kohärent halten kann. Claude Sonnet 4.5 unterstützt standardmäßige textbasierte Ein- und Ausgaben, ohne native multimodale Fähigkeiten für die Bild- oder Audioverarbeitung. Seine Architektur priorisiert Befolgung von Anweisungen, faktische Genauigkeit und das Einhalten angemessener Grenzen in den Antworten. Innerhalb von Anthropics Modellhierarchie nimmt Sonnet die mittlere Position zwischen den schnelleren, kostengünstigeren Haiku-Modellen und der leistungsfähigeren, aber ressourcenintensiveren Opus-Stufe ein. Diese Positionierung macht Claude Sonnet 4.5 für Anwendungen geeignet, die zuverlässige Leistung über vielfältige Aufgaben hinweg erfordern, ohne den Rechenaufwand der Flaggschiff-Modelle. Das Modell ist über Anthropics API sowie ausgewählte Partnerplattformen zugänglich und bedient Anwendungsfälle von der Automatisierung des Kundenservice über Unterstützung in der Softwareentwicklung bis hin zur Dokumentenanalyse in Unternehmens- und Entwicklerkontexten.

Claude Sonnet 4.5 verbessert Vorgänger iterativ und bleibt dabei das bevorzugte Mittelklassemodell von Anthropic.

Tokonomix-Benchmark-Zusammenfassung
Abschnitt 01

Geschwindigkeitsanalyse

Latenz über alle Benchmark-Läufe gemessen. P50 (Median) und P95 (95. Perzentil) zeigen ein realistisches Bild der Antwortgeschwindigkeit bei normaler und Spitzenlast.

P50-Latenz (Median)P95-Latenz97 runs
147216741886208822805-2206-15ms
Abschnitt 02

Qualitätswerte

Auswertungsergebnisse aus Judge-Model-Bewertungen über verschiedene Aufgabenkategorien. Werte spiegeln Kohärenz, Genauigkeit und Anweisungsbefolgung wider.

100
Codegenerierung
100
Mehrsprachig
100
Schlussfolgern
Abschnitt 03

Preisverlauf

Direkte Provider-Tarife pro Million Tokens, plus eine typische Gesprächskostenschätzung.

💰
API-Tarife — Claude Sonnet 4.5
$3.00 pro 1M Input-Tokens
$15.00 pro 1M Output-Tokens
≈ $0.0048 pro typischem Gespräch (800 Tokens)
Input- vs. Output-Preis (pro 1M Tokens)
pro 1M Input-Tokens$3.00
pro 1M Output-Tokens$15.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$3.00

input / 1M

— stable

$15.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Abschnitt 04

Tokens pro Sekunde

Durchsatz in Tokens pro Sekunde, abgeleitet aus gemessener P50-Latenz. Höhere Werte sind besser; Schwankungen spiegeln die Provider-seitige Last wider.

Durchsatz (Tokens / s)135 / avg 162
134277

Geschätzt aus P50-Latenz × 200 Output-Tokens — die absolute Zahl hängt von dieser Annahme ab; entscheidend ist der Trend.

Abschnitt 05

Stärken & Schwächen

Basierend auf Benchmark-Ergebnissen und aggregiertem Community-Feedback zu realen Anwendungsfällen.

Stärken

Iterative Verbesserungen gegenüber Sonnet 4200.000-Token-KontextfensterPräzises Instruction-FollowingCoding-Assistenz über viele SprachenHilfreiche, harmlose, ehrliche AusgabenBalance zwischen Qualität und Kosten

Schwächen

Nicht Opus-Niveau bei KomplexaufgabenKeine Audio- oder BildverarbeitungKein nativer Web-Zugang
Abschnitt 06

Fähigkeiten

toolssource: litellmvisionjson modepdf inputreasoningjson schemaprompt cachingmax output tokens: 64000
Abschnitt 07

Häufig gestellte Fragen

Sonnet 4.5 ist eine iterative Verbesserung mit besserem Reasoning und Instruction-Following, bleibt aber in derselben Effizienzklasse.

Wenn Zuverlässigkeit über viele Aufgaben hinweg gefragt ist, macht Sonnet 4.5 selten etwas falsch.

Tokonomix-Benchmark-Zusammenfassung
Abschnitt 08

Verfügbarkeit

Verfügbarkeit

Noch keine Messdaten

Es wurden noch nicht genug API-Aufrufe aufgezeichnet, um Verfügbarkeitsstatistiken für dieses Modell anzuzeigen. Daten erscheinen, sobald das Modell Live-Traffic erhält.

Abschnitt 09

Tokonomix-Benchmark-Urteile

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-596/100 · 76 runs
74 correct2 partial0 wrong97% accuracy
2026-06-14

Major capability expansion with tools, vision, and reasoning added

Claude Sonnet 4.5 has undergone a significant transformation with the addition of seven new capabilities: tools, vision, JSON mode, PDF input, reasoning, JSON schema, and prompt caching. This represents a fundamental expansion of the model's functionality beyond its previous text-only interface. The addition of vision capabilities allows the model to process images, while tools and JSON schema support enable structured interactions for application development. PDF input expands document handling, and the reasoning capability suggests enhanced problem-solving approaches. Prompt caching can improve efficiency for repeated interactions. These changes position Claude Sonnet 4.5 as a more versatile model suitable for multimodal applications and complex workflows. Users who previously relied on this model for text-only tasks will find it now supports a much broader range of use cases, from visual analysis to structured data extraction and tool-augmented reasoning. The scale of these additions indicates a major version update rather than incremental improvements, fundamentally changing what developers and users can accomplish with this model.

Quality

Latency p50

Test runs

0

Tools capability added Vision support enabled JSON schema support added PDF input now supported
Abschnitt 10

Vollständiges Modellprofil

Claude Sonnet 4.5 — illustration 1
Claude Sonnet 4.5: das bewährte Mid-Tier für die Produktion

Claude Sonnet 4.5 (claude-sonnet-4-5-20250929) ist der Sonnet-Snapshot vom Ende September 2025. Zweihunderttausend Token Kontextfenster. Text- und Vision-Eingabe. Das Mid-Tier-Modell, auf das die größte Gruppe von Produktions-Claude-Deployments letztendlich setzte.

Die treffendste Beschreibung: Sonnet 4.5 ist das, nach dem Teams greifen, wenn sie Opus angeschaut und entschieden haben, dass die Reasoning-Qualität mehr ist als sie wirklich brauchen, und Haiku angeschaut und entschieden haben, dass die Tiefe weniger ist als sie wollen. Es sitzt bewusst in der Mitte und macht die Mitte gut.

Warum dieser Snapshot sich durchgesetzt hat

Mehrere Dinge trafen in 4.5 gleichzeitig ein, die es zum Standard-Upgrade-Ziel für Teams machten, die Sonnet 4.0 liefen:

  • Sauberere JSON-Schema-Einhaltung. Frühere Sonnet-Snapshots wichen bei komplexen verschachtelten Schemas gelegentlich bei Feldnamen ab. 4.5 hält den Vertrag zuverlässig ein.
  • Straffere Ablehnungshaltung. Das Modell lehnt grenzwertige Prompts mit demselben Reasoning-Stil wie Opus ab, statt mit der etwas anderen Haltung früherer Sonnet-Snapshots.
  • Vorhersagbarere System-Prompt-Behandlung. Bei Konflikten zwischen System- und User-Prompt wägt 4.5 beide ab, statt still eines über das andere zu priorisieren.
  • Bessere Kohärenz bei langen Ausgaben. Mehrseitige Antworten halten zusammen, ohne in die Selbstwiederholung zu verfallen, in die frühere Sonnet-Snapshots manchmal abglitten.

Keine dieser Verbesserungen ist eine Benchmark-Schlagzeile. Alle sind wichtig, wenn man einen Agent-Loop oder eine strukturierte Extraktions-Pipeline betreibt und Fehler pro zehntausend Anfragen zählt.

Was das 200k-Fenster bringt

Zweihunderttausend Token reichen für eine umfangreiche Codebasis, einen langen Quartalsbericht oder ein mehrteiliges Due-Diligence-Dossier. Sonnet 4.5 hält die Aufmerksamkeit über den Großteil des Puffers vernünftig aufrecht, mit dem üblichen Vorbehalt, dass die Nadel-Retrieval-Qualität in der Mitte sehr langer Eingaben etwas nachlässt.

Wer seinen Workload regelmäßig jenseits von 150.000 Eingabe-Token schiebt, hat zwei praktische Optionen. Auf 4.5 bleiben und Prompt-Engineering-Muster nutzen, um das Modell zu verankern — die Frage am Ende des Kontexts wiederholen, die Eingabe mit klaren Abschnittsüberschriften strukturieren. Oder zu Sonnet 4.6 wechseln, das ein Million-Token-Fenster mit deutlich besserer Aufmerksamkeit in der Tiefe mitbringt. Das aktuelle Latenz-Bild finden Sie auf /benchmarks/speed.

Vision-Eingabe, die ihren Job macht

Die Vision-Fähigkeiten in 4.5 funktionieren für die üblichen Dokumentenleseaufgaben. Screenshots, gescannte PDFs als Seitenbilder, Dashboard-Aufnahmen, Diagramme. Tabellenextraktion ist sauber. Diagramme mit vernünftigen Beschriftungsgrößen werden korrekt beschrieben.

Handschrift ist die Schwachstelle. Ebenso dichte wissenschaftliche Abbildungen mit winzigen Beschriftungen. Alles, bei dem ein Mensch zum Lesen hineinzoomen müsste, profitiert von einem menschlichen Verifikationsschritt.

Der Vision-Stack ist über die 4.x-Linie geteilt. Wer Sonnet 4.5 speziell für Vision gegen Opus 4.5 oder Haiku 4.5 evaluiert, sollte ähnliches Verhalten mit dem üblichen Qualitätsgefälle nach Stufe erwarten.

Einordnung in die Modelllandschaft

Das ehrliche Wettbewerbsbild für Sonnet 4.5 Mitte 2026:

Gegenüber neueren Anthropic-Sonnet-Snapshots: Sonnet 4.6 ist das natürliche Upgrade-Ziel. Es trägt dieselbe Eingabe-Oberfläche plus ein Million-Token-Kontextfenster und inkrementelle Verbesserungen bei der Tool-Use-Politur. Für Workloads, die in 200k Token passen, ist die Wahl weitgehend operationell statt fähigkeitsgetrieben.

Gegenüber GPT-5-Mid-Tier und Gemini 2.5 Pro: Sonnet 4.5 wechselt Siege nach Kategorie. Es gewinnt bei Ablehnungskonsistenz, europäischsprachiger Verwaltungsprosa, Zuverlässigkeit bei strukturierter Ausgabe. Es verliert bei reiner Geschwindigkeit für kurze Gesprächsrunden und bei nativer multimodaler Eingabe über Bilder hinaus.

Einen direkten Vergleich bietet das /benchmarks/leaderboard; die Kategoriebewertungen sind auf /benchmarks/intelligence aufgeschlüsselt.

Wann es das falsche Werkzeug ist

Hochvolumige günstige Klassifizierung. Mid-Tier-Rechenleistung ist der falsche Aufwand für Millionen kurzer Prompts. Claude Haiku 4.5 oder Gemini 2.5 Flash erledigt das für eine andere Kostenstufe ohne merklichen Qualitätsverlust bei einfachen Aufgaben.

Echtzeit-Sprache. Sonnet 4.5 hat keine Audio-Eingabe. Den Voice-Pipeline-Leitfaden finden Sie auf /usecases/voice.

Workloads, die wirklich Top-of-Stack-Reasoning benötigen. Wenn die Aufgabe mehrstufiges formales Reasoning, komplexe Code-Refaktorierung über große Codebasen oder sorgfältige Synthese über viele Dokumente umfasst, ist eine Opus-Stufe die richtige Wahl. Sonnet 4.5 ist gut; Opus ist besser für diese spezifischen Fälle.

Code-Generierung unter sich schnell entwickelnden Frameworks, wenn idiomatischer Output gewünscht ist. Das Modell ist kompetent, aber konservativ. Für IDE-passendes Arbeiten vergleicht die Übersicht auf /usecases/code die Optionen.

Self-Hosted-Deployment oder Fine-Tuning. Anthropic liefert keine Gewichte und bietet kein Supervised-Fine-Tuning auf der Sonnet-Stufe. Open-Weight-Optionen für diese Anforderungen finden Sie auf /usecases/local.

Deployment-Hinweise

Standard-Anthropic-API. REST. Streaming. System-Prompts verhalten sich vorhersagbar. Die Tool-Use-Qualität ist hoch genug, um Produktionsagenten darauf aufzubauen, ohne defensive Parser zu schreiben.

Das Bild zur Datenresidenz ist dasselbe wie beim Rest der Claude-Linie. Inferenz läuft auf AWS und Google Cloud, und die öffentliche API bietet keinen Regionsauswahlparameter. EU-Residenz erfordert eine Enterprise-Vertragsverhandlung, keinen Einstellungsschalter. Bei strikten Residenzanforderungen prüfen Sie OVH-gehostete Alternativen.

Logs werden standardmäßig 30 Tage für die Missbrauchsüberwachung aufbewahrt. Eingaben werden nicht für das Training verwendet, sofern Sie dem nicht zustimmen. Zero-Retention ist ein Enterprise-Vertragsposten.

Wann Sie es einsetzen sollten

Greifen Sie zu Claude Sonnet 4.5, wenn:

  • Sie den am gründlichsten für die Produktion gehärteten Sonnet-Snapshot wollen, nicht unbedingt den neuesten.
  • Der Workload komfortabel in 200k Token Kontext passt.
  • Zuverlässigkeit bei strukturierter Ausgabe und Konsistenz bei Ablehnungen für Ihr Design wichtig sind.
  • Sie europäischsprachige Verwaltungs- oder Rechtstexte verarbeiten, bei denen terminologische Treue zählt.

Wählen Sie etwas anderes, wenn:

  • Sie routinemäßig mehr als 200k Token Kontext benötigen. Wechseln Sie zu Sonnet 4.6.
  • Sie Frontier-Tier-Reasoning benötigen. Wechseln Sie zu Opus.
  • Sie Sub-Cent-Kosten pro Aufruf brauchen. Wechseln Sie nach unten zu Haiku.
  • Audio, Sprache oder Video Teil des Workloads ist.

Zusammenfassung: Sonnet 4.5 ist die sichere Mid-Tier-Wahl für die Produktion. Die neueren Snapshots sind am führenden Rand fähiger, aber 4.5 ist das, nach dem die meisten Teams greifen werden — und das ist die richtige Entscheidung.

Testen Sie es gegen aktuelle Alternativen mit eigenen Prompts unter /live-test. Gleicher Prompt, mehrere Modelle, nebeneinander.

Letzte technische Überprüfung: 2026-05-22 — Tokonomix.ai

Claude Sonnet 4.5 — illustration 2
Letzter automatisierter Test
15. Juni 2026 · 08:00 UTC · Geschwindigkeits-Benchmark
P50-Latenz
1483 ms
P95-Latenz
1487 ms
Fehler
0 / 6 Läufe
Zuletzt geprüft von Tokonomix-Team·24. Mai 2026