Zum Inhalt
Läuft in:USErstellt in:United States
OpenAI

gpt-5-2025-08-07

Tokonomix-Redaktionsteam·Geprüft von Mes Kalkan··

GPT-5-2025-08-07 ist OpenAIs neuestes Sprachmodell der nächsten Generation, veröffentlicht im August 2025. Dieses Modell stellt einen bedeutenden architektonischen Fortschritt gegenüber der GPT-4-Serie dar und integriert verbesserte Reasoning-Fähigkeiten, erhöhte faktische Genauigkeit und robustere Leistung über verschiedene Natural Language Processing-Aufgaben hinweg. Es ist konzipiert für allgemeine Textgenerierung, einschließlich komplexer Analysen, kreativem Schreiben, technischer Dokumentation, Code-Generierung und mehrstufiger Problemlösung. Das Modell verfügt über standardmäßige Textgenerierungsfunktionen mit nicht offengelegter Kontextfenstergröße. GPT-5 zeigt bemerkenswerte Verbesserungen bei logischer Konsistenz, reduzierten Halluzinationsraten und besserem Instruction Following im Vergleich zu seinen Vorgängern. Es wurde mit einem aktuelleren Knowledge Cutoff als frühere Versionen trainiert, wobei OpenAI weder die spezifische Zusammensetzung der Trainingsdaten noch Parameteranzahlen offengelegt hat. Das Modell zeigt besondere Stärken beim Aufrechterhalten von Kohärenz über längere Konversationen hinweg und beim Umgang mit nuancierten Anweisungen, die das Interpretieren impliziter Nutzerabsichten erfordern. Innerhalb von OpenAIs Modell-Lineup positioniert sich GPT-5-2025-08-07 in der obersten Leistungsklasse als das leistungsfähigste allgemein verfügbare Modell. Es folgt auf die GPT-4-Familie, die Varianten wie GPT-4 Turbo und GPT-4o umfasste. Dieses Modell ist als OpenAIs Flaggschiff-Angebot für Nutzer positioniert, die fortschrittlichste Sprachverständnis- und Generierungsfähigkeiten benötigen. Die datumsbezogene Versionskennung bezeichnet diesen spezifischen Snapshot vom August 2025 und folgt OpenAIs Konvention, versionierte Releases für Konsistenz und Reproduzierbarkeit in Produktionsanwendungen bereitzustellen.

GPT-5-2025-08-07 markiert OpenAIs nächsten Generationssprung mit deutlich verbesserter Reasoning-Leistung und reduzierter Halluzinationsrate gegenüber der gesamten GPT-4-Familie.

Tokonomix Modellanalyse, August 2025
Abschnitt 01

Preisverlauf

Direkte Provider-Tarife pro Million Tokens, plus eine typische Gesprächskostenschätzung.

💰
API-Tarife — gpt-5-2025-08-07
$1.25 pro 1M Input-Tokens
$10.00 pro 1M Output-Tokens
≈ $0.0028 pro typischem Gespräch (800 Tokens)
Input- vs. Output-Preis (pro 1M Tokens)
pro 1M Input-Tokens$1.25
pro 1M Output-Tokens$10.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.25

input / 1M

— stable

$10.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Abschnitt 02

Stärken & Schwächen

Basierend auf Benchmark-Ergebnissen und aggregiertem Community-Feedback zu realen Anwendungsfällen.

Stärken

Überlegene Reasoning-FähigkeitenDeutlich reduzierte HalluzinationsrateExzellente Langtext-KohärenzPräzises Erfassen impliziter NutzerintentionStarke Code-GenerierungAktuellerer WissensstichtagRobuste Instruction-Following-GenauigkeitStabile Performance über lange Konversationen

Schwächen

Höhere Kosten als VorgängermodelleWissensstichtag trotzdem zeitlich begrenztKeine Multimodalität dokumentiertFehlende Transparenz zu Parameterzahl
Abschnitt 03

Fähigkeiten

toolssource: litellmvisionjson modepdf inputreasoningjson schemaparallel toolsprompt cachingmax output tokens: 128000
Abschnitt 04

Häufig gestellte Fragen

GPT-5 zeigt messbare Verbesserungen bei komplexen Reasoning-Aufgaben, logischer Konsistenz und Instruktionstreue. Die Halluzinationsrate wurde signifikant reduziert, besonders bei faktischen Abfragen. Für einfache Generierungs-Tasks bleibt der Unterschied moderat.

Für Anwendungen, die maximale Sprachverständnis-Fähigkeiten und konsistente Multi-Step-Reasoning erfordern, setzt GPT-5 derzeit den Benchmark – sofern Budget und fehlende Multimodalität keine Ausschlusskriterien darstellen.

Tokonomix Redaktion
Abschnitt 05

Verfügbarkeit

Verfügbarkeit

Noch keine Messdaten

Es wurden noch nicht genug API-Aufrufe aufgezeichnet, um Verfügbarkeitsstatistiken für dieses Modell anzuzeigen. Daten erscheinen, sobald das Modell Live-Traffic erhält.

Abschnitt 06

Tokonomix-Benchmark-Urteile

2026-06-14

GPT-5 maintains feature set with no benchmark performance changes

This benchmark window shows GPT-5 operating with stable performance across all measured dimensions. The model continues to offer the comprehensive feature set introduced in the previous window, including vision capabilities, tool use, PDF input processing, reasoning modes, and various JSON output formats including schema validation and parallel tool calls. Prompt caching remains available for optimization. No performance regressions or improvements were detected in this evaluation period. The model's baseline capabilities remain consistent with the previous assessment, suggesting a stable production release without significant updates to the underlying architecture or training. Users can expect the same level of functionality and performance characteristics observed in earlier testing. The lack of changes indicates OpenAI is maintaining this model version without modifications, which may be appropriate for a mature release. Organizations already using GPT-5 should experience consistent behavior. Those evaluating the model can rely on previous benchmarks remaining relevant for deployment decisions. The stability suggests this version has reached a steady state in its release cycle.

Quality

Latency p50

Test runs

0

No performance regressions detected Feature set remains stable
Abschnitt 07

Vollständiges Modellprofil

gpt-5-2025-08-07 — illustration 1
GPT-5 (Snapshot 2025-08-07): das eingefrorene Original

Hierbei handelt es sich um den datierten Snapshot des ursprünglichen GPT-5-Basismodells, veröffentlicht am 7. August 2025 und zu diesem Zeitpunkt eingefroren. Während der gleitende gpt-5-Slug bei Teams, die ihn referenziert haben, weiterhin verändert wurde, erfasst diese datierte Version genau einen bestimmten Satz von Gewichten, ein spezifisches Verhaltensprofil und ein reproduzierbares Artefakt. Das macht ihn nützlich für eine eng umrissene, aber wichtige Gruppe von Aufgaben: Vergleichsbasislinien, regulierte Workflows und alle Produkte, die in sechs Monaten auf dasselbe Modell zeigen und dieselbe Antwort erhalten müssen.

Warum datierte Snapshots existieren

OpenAI veröffentlicht jede Generation in zwei Varianten. Der gleitende Name (gpt-5) verweist stets auf den jeweils aktuell empfohlenen Snapshot. Der datierte Name (gpt-5-2025-08-07) fixiert eine spezifische Version der Gewichte. Der gleitende Slug profitiert von stillen Verbesserungen; der datierte Slug profitiert davon, niemals zu überraschen.

Für Evaluationsvergleiche über die Zeit ist der datierte Slug die einzige ehrliche Wahl. Wenn Ihr Benchmark-Report vom Dezember besagt „GPT-5 erreichte X in unserer Suite“, und jemand führt ihn im Mai gegen den gleitenden Slug erneut aus, dann werden nicht dieselben Modelle verglichen. Der datierte Snapshot behebt das. Das Verhalten vom 7. August 2025 ist genau jenes Verhalten, das Sie bei jedem Zugriff auf diesen Endpunkt erhalten, bis OpenAI ihn irgendwann abschaltet.

Was dieser Snapshot ist

GPT-5 war das erste Modell der GPT-5-Familie, veröffentlicht als multimodales Frontier-Modell für Text und Bild. Der Snapshot vom 2025-08-07 spiegelt das Verhalten zum Launch-Zeitpunkt wider: Trainingsdaten bis zu dem von OpenAI Mitte 2025 verwendeten Stichtag, der ursprüngliche Safety-Trainingsdurchlauf, die ursprüngliche Kalibrierung des Vision-Encoders, die ursprünglichen Verhaltensweisen bei der Tool-Nutzung.

Spätere Updates des gleitenden Slugs haben diese Eigenschaften verschoben. Dokumentierte Änderungen über die breitere 5.x-Linie hinweg umfassten verfeinertes Instruction-Following bei Grenzfällen, angepasstes Ablehnungsverhalten bei bestimmten Inhaltskategorien sowie inkrementelle Verbesserungen bei der Vision-OCR. Keine dieser Änderungen berührt diesen Snapshot. Was Sie im August 2025 erhalten haben, ist das, was Sie auch heute bekommen.

Unter der Haube

Das Modell ist ein Transformer-Decoder, der verschachtelte Text- und Bildeingaben akzeptiert und ausschließlich Textausgaben erzeugt. Parameteranzahl, Details zum Expert-Routing und die exakten architektonischen Entscheidungen sind nicht öffentlich. Die Tokenisierung verwendet das GPT-5-BPE-Vokabular. Bildeingaben werden in Kacheln zu festen Token-Kosten pro Kachel kodiert, was sich bei mehrseitigen Dokumenten-Workloads schnell summiert.

Der Trainings-Cutoff für diesen Snapshot liegt in der Mitte des Jahres 2025. Das Modell kennt die zu jenem Zeitpunkt gängigen Sprachstandards und Framework-Versionen und wird zu allem Neueren munter halluzinieren. Für Workflows, die aktuelle Ereignisse oder neue Bibliotheks-APIs betreffen, ist das relevant — fixieren Sie den Snapshot, akzeptieren Sie, dass Wissen altert, und leiten Sie Anfragen zu aktuellen Ereignissen über Retrieval oder Websuche, statt sich auf das parametrische Wissen des Modells zu verlassen.

Wo es heute steht

Im Vergleich zur breiteren Frontier-Modelllandschaft liegt der August-2025-Snapshot von GPT-5 im oberen Bereich bei allgemeinen Aufgaben und im oberen Mittelfeld bei vision-lastigen Arbeiten. Die neueren Snapshots 5.1, 5.2 und spätere Versionen haben ihn in den meisten Metriken überholt. Das Intelligenz-Leaderboard verfolgt die vergleichende Rangordnung.

Für einen im August 2025 fixierten Snapshot ist das das erwartete Muster. Es geht nicht darum, im Mai 2026 das absolut beste verfügbare Modell zu sein; es geht darum, im Mai 2026 dasselbe Modell wie im August 2025 zu sein, damit Vergleiche und Audits gültig bleiben.

Wann auf diesen Snapshot fixieren

Greifen Sie zu gpt-5-2025-08-07, wenn Reproduzierbarkeit wertvoller ist als Spitzenqualität. Die klaren Anwendungsfälle:

Evaluationsvergleiche über die Zeit. Wenn Ihre Benchmark-Suite zum Erscheinungszeitpunkt gegen diesen Snapshot lief, führen Sie sie erneut gegen denselben Snapshot aus statt gegen den gleitenden Slug. Andernfalls messen Sie die Modellentwicklung statt Ihrer eigenen Veränderungen.

Regulierte Entscheidungen, bei denen Audit-Trails das exakte Modell identifizieren müssen, das eine bestimmte Ausgabe erzeugt hat. „Wir haben gpt-5 verwendet“ ist eine unzureichende Antwort, wenn ein Prüfer nach der Version fragt. „Wir haben gpt-5-2025-08-07 verwendet“ ist hinreichend.

Kundenseitige Funktionen mit Qualitäts-SLAs, die gegen ein spezifisches Modellverhalten kalibriert wurden. Wenn Ihre Prompts und Few-Shot-Beispiele auf diesen Snapshot abgestimmt sind, riskiert ein Wechsel zu einem neueren ohne erneutes Tuning subtile Regressionen.

Langlaufende A/B-Experimente, bei denen die Kontrollgruppe für die Dauer des Tests wirklich konstant bleiben muss.

Wann nicht auf diesen Snapshot fixieren

Vermeiden Sie ihn bei der Entwicklung neuer Funktionen. Verwenden Sie stattdessen den gleitenden Slug oder den jüngsten datierten Snapshot; während Sie etwas bauen, wollen Sie das leistungsfähigste verfügbare Modell, nicht das älteste, das noch funktioniert.

Vermeiden Sie ihn bei allgemeinen Chat- und Content-Workflows, in denen die Verbesserungen neuerer Snapshots real sind und die Kosten einer Verhaltensdrift gering ausfallen. Die Snapshots 5.1, 5.2 und spätere sind in denselben Workloads besser. Fixieren Sie nur dann auf die Vergangenheit, wenn die Vergangenheit zählt.

Vermeiden Sie ihn, wenn Sie einen Prompt einsetzen, der sich auf Wissen über Ereignisse nach Mitte 2025 stützt. Das Modell kennt sie nicht. Es wird raten. Die Vermutungen werden manchmal richtig klingen und manchmal völlig falsch sein.

Betriebliche Hinweise

OpenAI veröffentlicht Deprecation-Zeitpläne für datierte Snapshots. Ältere Snapshots werden irgendwann abgeschaltet. Wenn das mit diesem geschieht, beginnt Ihr Code, der auf diesen Slug fixiert ist, Fehler zurückzugeben. Planen Sie vorausschauend: Abonnieren Sie die Deprecation-Ankündigungen und pflegen Sie einen Migrationspfad zu dem Snapshot, auf den Sie als Nächstes fixieren werden.

Für Datenextraktions-Workflows, bei denen die Vision-Fähigkeit tragend ist, ist der August-2025-Snapshot kompetent, wurde aber durch spätere Verfeinerungen des Vision-Encoders übertroffen. Wenn der Arbeitskontext es zulässt, verarbeiten Sie dieselben Dokumente einige Wochen lang parallel durch diesen Snapshot und einen neueren, bevor Sie über eine Migration der Fixierung entscheiden.

Alternativen

Für Workflows, die dieselbe Art von fixierter Reproduzierbarkeit benötigen, aber ein anderes Modell bevorzugen, liefert mittlerweile jeder Frontier-Anbieter datierte Snapshots neben den gleitenden Slugs. Das Muster ist Industriestandard. Wählen Sie das Modell, das Ihren Qualitäts- und Modalitätsanforderungen entspricht, und fixieren Sie dann die datierte Version statt der gleitenden.

Für reine Kostenoptimierung bei Routine-Workloads decken die kleineren Mitglieder der 5.x-Familie (die Mini- und Nano-Tiers) das meiste ab, was allgemeiner Chat tatsächlich benötigt, zu einem Bruchteil der Kosten. Fixieren Sie auch diese Snapshots, wenn Ihnen Reproduzierbarkeit dort wichtig ist.

Letzte technische Überprüfung: 2026-05-22 — Tokonomix.ai

gpt-5-2025-08-07 — illustration 2gpt-5-2025-08-07 — illustration 3
Letzter automatisierter Test
14. Juni 2026 · 04:58 UTC · Benchmark
P50-Latenz
P95-Latenz
Fehler
1 / 6 Läufe
Zuletzt geprüft von Tokonomix-Team·26. Mai 2026