
Claude Sonnet 4.5 (claude-sonnet-4-5-20250929) ist der Sonnet-Snapshot vom Ende September 2025. Zweihunderttausend Token Kontextfenster. Text- und Vision-Eingabe. Das Mid-Tier-Modell, auf das die größte Gruppe von Produktions-Claude-Deployments letztendlich setzte.
Die treffendste Beschreibung: Sonnet 4.5 ist das, nach dem Teams greifen, wenn sie Opus angeschaut und entschieden haben, dass die Reasoning-Qualität mehr ist als sie wirklich brauchen, und Haiku angeschaut und entschieden haben, dass die Tiefe weniger ist als sie wollen. Es sitzt bewusst in der Mitte und macht die Mitte gut.
Warum dieser Snapshot sich durchgesetzt hat
Mehrere Dinge trafen in 4.5 gleichzeitig ein, die es zum Standard-Upgrade-Ziel für Teams machten, die Sonnet 4.0 liefen:
- Sauberere JSON-Schema-Einhaltung. Frühere Sonnet-Snapshots wichen bei komplexen verschachtelten Schemas gelegentlich bei Feldnamen ab. 4.5 hält den Vertrag zuverlässig ein.
- Straffere Ablehnungshaltung. Das Modell lehnt grenzwertige Prompts mit demselben Reasoning-Stil wie Opus ab, statt mit der etwas anderen Haltung früherer Sonnet-Snapshots.
- Vorhersagbarere System-Prompt-Behandlung. Bei Konflikten zwischen System- und User-Prompt wägt 4.5 beide ab, statt still eines über das andere zu priorisieren.
- Bessere Kohärenz bei langen Ausgaben. Mehrseitige Antworten halten zusammen, ohne in die Selbstwiederholung zu verfallen, in die frühere Sonnet-Snapshots manchmal abglitten.
Keine dieser Verbesserungen ist eine Benchmark-Schlagzeile. Alle sind wichtig, wenn man einen Agent-Loop oder eine strukturierte Extraktions-Pipeline betreibt und Fehler pro zehntausend Anfragen zählt.
Was das 200k-Fenster bringt
Zweihunderttausend Token reichen für eine umfangreiche Codebasis, einen langen Quartalsbericht oder ein mehrteiliges Due-Diligence-Dossier. Sonnet 4.5 hält die Aufmerksamkeit über den Großteil des Puffers vernünftig aufrecht, mit dem üblichen Vorbehalt, dass die Nadel-Retrieval-Qualität in der Mitte sehr langer Eingaben etwas nachlässt.
Wer seinen Workload regelmäßig jenseits von 150.000 Eingabe-Token schiebt, hat zwei praktische Optionen. Auf 4.5 bleiben und Prompt-Engineering-Muster nutzen, um das Modell zu verankern — die Frage am Ende des Kontexts wiederholen, die Eingabe mit klaren Abschnittsüberschriften strukturieren. Oder zu Sonnet 4.6 wechseln, das ein Million-Token-Fenster mit deutlich besserer Aufmerksamkeit in der Tiefe mitbringt. Das aktuelle Latenz-Bild finden Sie auf /benchmarks/speed.
Vision-Eingabe, die ihren Job macht
Die Vision-Fähigkeiten in 4.5 funktionieren für die üblichen Dokumentenleseaufgaben. Screenshots, gescannte PDFs als Seitenbilder, Dashboard-Aufnahmen, Diagramme. Tabellenextraktion ist sauber. Diagramme mit vernünftigen Beschriftungsgrößen werden korrekt beschrieben.
Handschrift ist die Schwachstelle. Ebenso dichte wissenschaftliche Abbildungen mit winzigen Beschriftungen. Alles, bei dem ein Mensch zum Lesen hineinzoomen müsste, profitiert von einem menschlichen Verifikationsschritt.
Der Vision-Stack ist über die 4.x-Linie geteilt. Wer Sonnet 4.5 speziell für Vision gegen Opus 4.5 oder Haiku 4.5 evaluiert, sollte ähnliches Verhalten mit dem üblichen Qualitätsgefälle nach Stufe erwarten.
Einordnung in die Modelllandschaft
Das ehrliche Wettbewerbsbild für Sonnet 4.5 Mitte 2026:
Gegenüber neueren Anthropic-Sonnet-Snapshots: Sonnet 4.6 ist das natürliche Upgrade-Ziel. Es trägt dieselbe Eingabe-Oberfläche plus ein Million-Token-Kontextfenster und inkrementelle Verbesserungen bei der Tool-Use-Politur. Für Workloads, die in 200k Token passen, ist die Wahl weitgehend operationell statt fähigkeitsgetrieben.
Gegenüber GPT-5-Mid-Tier und Gemini 2.5 Pro: Sonnet 4.5 wechselt Siege nach Kategorie. Es gewinnt bei Ablehnungskonsistenz, europäischsprachiger Verwaltungsprosa, Zuverlässigkeit bei strukturierter Ausgabe. Es verliert bei reiner Geschwindigkeit für kurze Gesprächsrunden und bei nativer multimodaler Eingabe über Bilder hinaus.
Einen direkten Vergleich bietet das /benchmarks/leaderboard; die Kategoriebewertungen sind auf /benchmarks/intelligence aufgeschlüsselt.
Wann es das falsche Werkzeug ist
Hochvolumige günstige Klassifizierung. Mid-Tier-Rechenleistung ist der falsche Aufwand für Millionen kurzer Prompts. Claude Haiku 4.5 oder Gemini 2.5 Flash erledigt das für eine andere Kostenstufe ohne merklichen Qualitätsverlust bei einfachen Aufgaben.
Echtzeit-Sprache. Sonnet 4.5 hat keine Audio-Eingabe. Den Voice-Pipeline-Leitfaden finden Sie auf /usecases/voice.
Workloads, die wirklich Top-of-Stack-Reasoning benötigen. Wenn die Aufgabe mehrstufiges formales Reasoning, komplexe Code-Refaktorierung über große Codebasen oder sorgfältige Synthese über viele Dokumente umfasst, ist eine Opus-Stufe die richtige Wahl. Sonnet 4.5 ist gut; Opus ist besser für diese spezifischen Fälle.
Code-Generierung unter sich schnell entwickelnden Frameworks, wenn idiomatischer Output gewünscht ist. Das Modell ist kompetent, aber konservativ. Für IDE-passendes Arbeiten vergleicht die Übersicht auf /usecases/code die Optionen.
Self-Hosted-Deployment oder Fine-Tuning. Anthropic liefert keine Gewichte und bietet kein Supervised-Fine-Tuning auf der Sonnet-Stufe. Open-Weight-Optionen für diese Anforderungen finden Sie auf /usecases/local.
Deployment-Hinweise
Standard-Anthropic-API. REST. Streaming. System-Prompts verhalten sich vorhersagbar. Die Tool-Use-Qualität ist hoch genug, um Produktionsagenten darauf aufzubauen, ohne defensive Parser zu schreiben.
Das Bild zur Datenresidenz ist dasselbe wie beim Rest der Claude-Linie. Inferenz läuft auf AWS und Google Cloud, und die öffentliche API bietet keinen Regionsauswahlparameter. EU-Residenz erfordert eine Enterprise-Vertragsverhandlung, keinen Einstellungsschalter. Bei strikten Residenzanforderungen prüfen Sie OVH-gehostete Alternativen.
Logs werden standardmäßig 30 Tage für die Missbrauchsüberwachung aufbewahrt. Eingaben werden nicht für das Training verwendet, sofern Sie dem nicht zustimmen. Zero-Retention ist ein Enterprise-Vertragsposten.
Wann Sie es einsetzen sollten
Greifen Sie zu Claude Sonnet 4.5, wenn:
- Sie den am gründlichsten für die Produktion gehärteten Sonnet-Snapshot wollen, nicht unbedingt den neuesten.
- Der Workload komfortabel in 200k Token Kontext passt.
- Zuverlässigkeit bei strukturierter Ausgabe und Konsistenz bei Ablehnungen für Ihr Design wichtig sind.
- Sie europäischsprachige Verwaltungs- oder Rechtstexte verarbeiten, bei denen terminologische Treue zählt.
Wählen Sie etwas anderes, wenn:
- Sie routinemäßig mehr als 200k Token Kontext benötigen. Wechseln Sie zu Sonnet 4.6.
- Sie Frontier-Tier-Reasoning benötigen. Wechseln Sie zu Opus.
- Sie Sub-Cent-Kosten pro Aufruf brauchen. Wechseln Sie nach unten zu Haiku.
- Audio, Sprache oder Video Teil des Workloads ist.
Zusammenfassung: Sonnet 4.5 ist die sichere Mid-Tier-Wahl für die Produktion. Die neueren Snapshots sind am führenden Rand fähiger, aber 4.5 ist das, nach dem die meisten Teams greifen werden — und das ist die richtige Entscheidung.
Testen Sie es gegen aktuelle Alternativen mit eigenen Prompts unter /live-test. Gleicher Prompt, mehrere Modelle, nebeneinander.
Letzte technische Überprüfung: 2026-05-22 — Tokonomix.ai
