
gpt-4o-2024-05-13 ist das ursprüngliche GPT-4o-Release, eingefroren auf den Stand der ersten öffentlichen Verfügbarkeit des Modells am 13. Mai 2024. Es ist der datierte Pin für OpenAIs erstes multimodales Modell der ersten Generation — jenes, das einheitliches Text-Bild-Audio-Verhalten einführte und die Erwartungen des Feldes an die Oberfläche eines Frontier-Modells neu definierte.
Für die meisten Teams ist dieser Snapshot mittlerweile zu alt, um empfohlen zu werden. Für die enge Auswahl an Fällen, in denen Reproduzierbarkeit gegen das Launch-Modell wichtiger ist als jede nachfolgende Verbesserung, bleibt er verfügbar.
Warum genau dieses Datum zählt
Mit dem Launch am 13. Mai 2024 hörte Multimodalität auf, ein Forschungsdemo zu sein, und wurde zum Deployment-Ziel. Frühere GPT-4-Varianten hatten Vision-Unterstützung, aber die Audio-Oberfläche und die niedrigere Latenz bei Text waren der Beitrag von 4o. Teams, die Evaluierungen eingereicht oder Anbieterverträge gegen das Launch-Modell formuliert haben, wollen einen stabilen Referenzpunkt; dieser Snapshot ist dieser Referenzpunkt.
Zwei konkrete Gründe, sich um genau dieses Datum zu kümmern.
Erstens: Vergleichsarbeit. Forschungsteams, die über Modellfähigkeiten über Generationen hinweg schreiben, benötigen ein Modell, das sich nicht still unter ihren Experimenten verändert hat. Der Launch-Snapshot ist das Modell, das in den ursprünglichen OpenAI-Release-Notes und in den meisten Drittanbieter-Evaluierungsarbeiten aus der Mitte des Jahres 2024 bewertet wurde.
Zweitens: regulierte Deployments, die gegen das Launch-Modell genehmigt wurden. Einige Compliance-Regime verlangen, dass jedes Modell, das mit Produktionsdaten in Berührung kommt, einen bestimmten Evaluierungszyklus durchlaufen hat. Wenn Ihr Auditor das Release vom Mai 2024 genehmigt hat und die Migration auf einen neueren Snapshot noch nicht durch die Prüfung ist, ist dies das Modell, das Sie betreiben.
Was in diesem Snapshot ausgeliefert wird
Alles, was OpenAI am Launch-Tag ausgeliefert hat. Text- und Bildeingabe mit einem 128k-Token-Kontextfenster. Audio-Oberflächen über die zeitgleichen Endpunkte. JSON-Modus, aber nicht das spätere Feature der strukturierten Ausgaben — das kam mit dem Release vom 6. August 2024. Function Calling. Streaming. Die Chat-Completions-Oberfläche; die Responses-Oberfläche wurde später hinzugefügt und ist nicht Teil des Verhaltens dieses Snapshots.
Was in diesem Snapshot nicht enthalten ist, ist alles, was in den späteren 4o-Releases gelandet ist. Das Update vom 6. August fügte strikte strukturierte Ausgaben hinzu und straffte das JSON-Modus-Verhalten. Das Update vom 20. November brachte Verbesserungen bei Reasoning und Schreibqualität. Keines davon ist im Mai-Snapshot enthalten. Wenn Ihre nachgelagerte Pipeline von einem bestimmten Verhalten bei strukturierten Ausgaben abhängt, prüfen Sie, gegen welchen Snapshot sie gebaut wurde, bevor Sie annehmen, dass der Mai-Pin die richtige Wahl ist.
Sunset-Risiko
Dies ist der älteste 4o-Snapshot, der noch routinemäßig verfügbar ist, was bedeutet, dass er seinem Sunset-Datum am nächsten ist. OpenAIs typischer Deprecation-Horizont für datierte Snapshots reicht von zwölf bis achtzehn Monaten ab Release. Das Launch-Modell vom Mai 2024 hat das frühe Ende dieses Zeitfensters bereits überschritten.
Planen Sie die Migration aktiv. Beachten Sie, dass „der Snapshot antwortet heute noch" keine Garantie dafür ist, dass er morgen noch antworten wird. Setzen Sie eine Kalendererinnerung, führen Sie eine erneute Evaluierung gegen gpt-4o-2024-11-20 oder gegen den schwebenden gpt-4o-Tag durch, um den Verhaltens-Delta als Baseline festzulegen, und halten Sie die Migration bereit, bevor das Deprecation-Datum angekündigt wird, und nicht erst danach.
Teams, die auf die Deprecation-Mail warten, entdecken in der Regel, dass ihre Produktionspipeline von einem bestimmten Verhalten des Launch-Snapshots abhing, das die neueren Snapshots stillschweigend verändert haben. Die Migrationsarbeit ist teurer, wenn man sie unter Zeitdruck durchführt.
Was sich zwischen diesem und späteren Snapshots geändert hat
Die Verhaltens-Deltas, die es zu kennen lohnt, wenn Sie entscheiden, ob Sie beim Launch-Pin bleiben oder weiterziehen wollen.
Strukturierte Ausgaben. Der Mai-Snapshot unterstützt JSON-Modus, erzwingt Schemata aber nicht so strikt wie das August-Release. Nachgelagerte Parser, die sich auf Schema-Validierung stützen, können gegen diesen Snapshot häufiger fehlschlagen.
Verweigerungs-Kalibrierung. Das Launch-Modell ist bei bestimmten Verweigerungsmustern aggressiver als spätere Snapshots. Einige legitime Prompts werden hier abgelehnt, die im November sauber durchgehen.
Reasoning. Der November-Snapshot ist bei mehrstufigen Prompts sichtbar stärker. Für Workloads, die die Reasoning-Qualität testen, ist die Lücke substanziell.
Latenz. Verbesserungen am Inferenz-Stack im Verlauf des Jahres 2024 bedeuten, dass der schwebende Tag jetzt dieselbe Modellklasse mit geringerer Latenz bedient als der Launch-Snapshot. Wer auf dieses Datum pinnt, verzichtet auf diese Verbesserungen.
Pin-Muster
Das Muster, das sich gut bewährt hat:
- Im Eval, in CI und in jedem compliance-auditierten Pfad pinnen.
- Im Produktionsverkehr floaten.
- Wöchentlich zwischen gepinnt und schwebend gegen einen festen Prompt-Set diffen, um Verhaltensdrift früh zu erkennen.
Speziell für den Launch-Snapshot vom Mai 2024 hinzuzufügen: einen dokumentierten Migrationsplan zu einem neueren 4o-Snapshot oder zur GPT-4.1-Familie haben, bevor das Deprecation-Datum eintrifft.
Für den breiteren 4o-Kontext siehe die schwebende GPT-4o-Seite. Für die neuere Familie, auf die die meisten neuen Builds abzielen sollten, siehe GPT-4.1.
Auswahl
Verwenden Sie gpt-4o-2024-05-13, wenn:
- Sie ein spezifisches Ergebnis reproduzieren, das an das Launch-Modell gebunden ist.
- Ein Compliance-Regime genau diesen Identifier genehmigt hat und eine erneute Genehmigung in Bearbeitung ist.
- Ein Forschungs-Workflow das Referenzverhalten vom Mai 2024 erfordert.
Für alles andere wechseln Sie zu einem neueren Snapshot oder zum schwebenden Tag. Der Launch-Snapshot war ein Meilenstein; er ist nicht mehr die richtige Serving-Stufe.
Letzte technische Überprüfung: 2026-05-22 — Tokonomix.ai
