Tier C — Spezialist

Läuft in:USErstellt in:United States

$15.00

Ausgabe · pro 1M Tokens (Kostenbasis)

Kosten

1,695 ms

Antwortgeschwindigkeit

100 / 100

Intelligenz

Verdict — ZusammenfassungLIVE

● LIVE

jetzt · 2026-07-26

Quality decline and latency increase observed across core performance metrics

✗ Quality score dropped 5 points✗ Latency increased 43%✓ Multilingual performance remains perfect✓ Strong reasoning score at 99

This benchmark window reveals notable performance degradation for gpt-4o-2024-05-13 compared to the previous evaluation period. The overall quality score dropped from 98.3 to 93.4, representing a 5-point decline that affects the model's competitive positioning. Latency deteriorated significantly, with the median response time increasing 43% from 1235ms to 1766ms, which may impact user experience in interactive applications. Category performance shows mixed results. Multilingual capabilities remained excellent at 100, maintaining parity with previous performance. Reasoning scored impressively at 99, demonstrating strong logical capabilities. However, factual accuracy scored only 83, suggesting potential reliability concerns for knowledge-intensive tasks. Creative performance at 92 shows a slight decline from the previous 95. The absence of coding scores in the current window prevents direct comparison in this critical category, though it previously achieved a perfect 100. Users should be aware of the latency increase when deploying this model in time-sensitive applications. The quality score reduction, while keeping the model in high-performance territory, indicates some regression that may warrant monitoring. Organizations relying on factual accuracy should conduct additional validation given the lower score in this category.

Quality

93.4

Latency p50

1,766 ms

Test runs

1 von 14

Bild & ErklärungLIVE

OpenAI

gpt-4o-2024-05-13

Tier C — Spezialist

Tokonomix-Redaktionsteam·Geprüft von Mes Kalkan·Veröffentlicht 22. Mai 2026·Zuletzt geprüft 26. Mai 2026

GPT-4o-2024-05-13 ist ein großes multimodales Sprachmodell, das von OpenAI entwickelt und im Mai 2024 veröffentlicht wurde. Dieses Modell stellt OpenAIs erste Iteration der GPT-4o-Serie dar, wobei die Bezeichnung "o" eine Optimierung für sowohl Text- als auch multimodale Eingaben kennzeichnet. Es ist für allgemeine Textgenerierungsaufgaben konzipiert, einschließlich Konversation, Content-Erstellung, Analyse, Programmierunterstützung und Reasoning über verschiedene Bereiche hinweg. Das Modell verarbeitet Texteingaben und generiert Textausgaben mit Fähigkeiten, die mehrere Sprachen und technische Fachgebiete umfassen. Diese Version dient als initiale Produktionsveröffentlichung der GPT-4o-Architektur und bietet standardmäßige Textgenerierungsfähigkeiten, die Performance mit Zugänglichkeit in Einklang bringen. Während spezifische Architekturdetails proprietär bleiben, baut das Modell auf der Grundlage auf, die durch frühere GPT-4-Varianten geschaffen wurde, und führt architektonische Verfeinerungen ein, die auf verbesserte Effizienz und Antwortqualität abzielen. Das Modell unterstützt erweiterte Konversationen und komplexe Anweisungen, was es für Anwendungen geeignet macht, die von einfachen Frage-Antwort-Aufgaben bis hin zu anspruchsvollen analytischen Tasks reichen. Innerhalb von OpenAIs Modell-Lineup nimmt GPT-4o-2024-05-13 eine zentrale Position als Flaggschiff-Modell für allgemeine Zwecke ein. Es steht neben anderen GPT-4-Varianten im Angebot von OpenAI und bietet eine Alternative zu früheren GPT-4-Versionen und der kompakteren GPT-3.5-Serie. Das Modell ist für Nutzer positioniert, die fortgeschrittene Sprachverständnis- und Generierungsfähigkeiten benötigen, ohne die spezialisierten Features von domänenspezifischen oder experimentellen Varianten. Dieser Snapshot repräsentiert den Stand des Modells zum Zeitpunkt seiner Veröffentlichung im Mai 2024.

Der erste GPT-4o-Snapshot vom Mai 2024: die Erstversion von OpenAIs Omni-Architektur in der Produktionsumgebung.
— Tokonomix-Benchmark-Zusammenfassung

Fähigkeiten

toolssource: litellmvisionpdf inputparallel toolsprompt cachingmax output tokens: 4096

gpt-4o-2024-05-13: die Launch-Momentaufnahme

gpt-4o-2024-05-13 ist das ursprüngliche GPT-4o-Release, eingefroren auf den Stand der ersten öffentlichen Verfügbarkeit des Modells am 13. Mai 2024. Es ist der datierte Pin für OpenAIs erstes multimodales Modell der ersten Generation — jenes, das einheitliches Text-Bild-Audio-Verhalten einführte und die Erwartungen des Feldes an die Oberfläche eines Frontier-Modells neu definierte.

Für die meisten Teams ist dieser Snapshot mittlerweile zu alt, um empfohlen zu werden. Für die enge Auswahl an Fällen, in denen Reproduzierbarkeit gegen das Launch-Modell wichtiger ist als jede nachfolgende Verbesserung, bleibt er verfügbar.

Warum genau dieses Datum zählt

Mit dem Launch am 13. Mai 2024 hörte Multimodalität auf, ein Forschungsdemo zu sein, und wurde zum Deployment-Ziel. Frühere GPT-4-Varianten hatten Vision-Unterstützung, aber die Audio-Oberfläche und die niedrigere Latenz bei Text waren der Beitrag von 4o. Teams, die Evaluierungen eingereicht oder Anbieterverträge gegen das Launch-Modell formuliert haben, wollen einen stabilen Referenzpunkt; dieser Snapshot ist dieser Referenzpunkt.

Zwei konkrete Gründe, sich um genau dieses Datum zu kümmern.

Erstens: Vergleichsarbeit. Forschungsteams, die über Modellfähigkeiten über Generationen hinweg schreiben, benötigen ein Modell, das sich nicht still unter ihren Experimenten verändert hat. Der Launch-Snapshot ist das Modell, das in den ursprünglichen OpenAI-Release-Notes und in den meisten Drittanbieter-Evaluierungsarbeiten aus der Mitte des Jahres 2024 bewertet wurde.

Zweitens: regulierte Deployments, die gegen das Launch-Modell genehmigt wurden. Einige Compliance-Regime verlangen, dass jedes Modell, das mit Produktionsdaten in Berührung kommt, einen bestimmten Evaluierungszyklus durchlaufen hat. Wenn Ihr Auditor das Release vom Mai 2024 genehmigt hat und die Migration auf einen neueren Snapshot noch nicht durch die Prüfung ist, ist dies das Modell, das Sie betreiben.

Was in diesem Snapshot ausgeliefert wird

Alles, was OpenAI am Launch-Tag ausgeliefert hat. Text- und Bildeingabe mit einem 128k-Token-Kontextfenster. Audio-Oberflächen über die zeitgleichen Endpunkte. JSON-Modus, aber nicht das spätere Feature der strukturierten Ausgaben — das kam mit dem Release vom 6. August 2024. Function Calling. Streaming. Die Chat-Completions-Oberfläche; die Responses-Oberfläche wurde später hinzugefügt und ist nicht Teil des Verhaltens dieses Snapshots.

Was in diesem Snapshot nicht enthalten ist, ist alles, was in den späteren 4o-Releases gelandet ist. Das Update vom 6. August fügte strikte strukturierte Ausgaben hinzu und straffte das JSON-Modus-Verhalten. Das Update vom 20. November brachte Verbesserungen bei Reasoning und Schreibqualität. Keines davon ist im Mai-Snapshot enthalten. Wenn Ihre nachgelagerte Pipeline von einem bestimmten Verhalten bei strukturierten Ausgaben abhängt, prüfen Sie, gegen welchen Snapshot sie gebaut wurde, bevor Sie annehmen, dass der Mai-Pin die richtige Wahl ist.

Sunset-Risiko

Dies ist der älteste 4o-Snapshot, der noch routinemäßig verfügbar ist, was bedeutet, dass er seinem Sunset-Datum am nächsten ist. OpenAIs typischer Deprecation-Horizont für datierte Snapshots reicht von zwölf bis achtzehn Monaten ab Release. Das Launch-Modell vom Mai 2024 hat das frühe Ende dieses Zeitfensters bereits überschritten.

Planen Sie die Migration aktiv. Beachten Sie, dass „der Snapshot antwortet heute noch" keine Garantie dafür ist, dass er morgen noch antworten wird. Setzen Sie eine Kalendererinnerung, führen Sie eine erneute Evaluierung gegen gpt-4o-2024-11-20 oder gegen den schwebenden gpt-4o-Tag durch, um den Verhaltens-Delta als Baseline festzulegen, und halten Sie die Migration bereit, bevor das Deprecation-Datum angekündigt wird, und nicht erst danach.

Teams, die auf die Deprecation-Mail warten, entdecken in der Regel, dass ihre Produktionspipeline von einem bestimmten Verhalten des Launch-Snapshots abhing, das die neueren Snapshots stillschweigend verändert haben. Die Migrationsarbeit ist teurer, wenn man sie unter Zeitdruck durchführt.

Was sich zwischen diesem und späteren Snapshots geändert hat

Die Verhaltens-Deltas, die es zu kennen lohnt, wenn Sie entscheiden, ob Sie beim Launch-Pin bleiben oder weiterziehen wollen.

Strukturierte Ausgaben. Der Mai-Snapshot unterstützt JSON-Modus, erzwingt Schemata aber nicht so strikt wie das August-Release. Nachgelagerte Parser, die sich auf Schema-Validierung stützen, können gegen diesen Snapshot häufiger fehlschlagen.

Verweigerungs-Kalibrierung. Das Launch-Modell ist bei bestimmten Verweigerungsmustern aggressiver als spätere Snapshots. Einige legitime Prompts werden hier abgelehnt, die im November sauber durchgehen.

Reasoning. Der November-Snapshot ist bei mehrstufigen Prompts sichtbar stärker. Für Workloads, die die Reasoning-Qualität testen, ist die Lücke substanziell.

Latenz. Verbesserungen am Inferenz-Stack im Verlauf des Jahres 2024 bedeuten, dass der schwebende Tag jetzt dieselbe Modellklasse mit geringerer Latenz bedient als der Launch-Snapshot. Wer auf dieses Datum pinnt, verzichtet auf diese Verbesserungen.

Pin-Muster

Das Muster, das sich gut bewährt hat:

Im Eval, in CI und in jedem compliance-auditierten Pfad pinnen.
Im Produktionsverkehr floaten.
Wöchentlich zwischen gepinnt und schwebend gegen einen festen Prompt-Set diffen, um Verhaltensdrift früh zu erkennen.

Speziell für den Launch-Snapshot vom Mai 2024 hinzuzufügen: einen dokumentierten Migrationsplan zu einem neueren 4o-Snapshot oder zur GPT-4.1-Familie haben, bevor das Deprecation-Datum eintrifft.

Für den breiteren 4o-Kontext siehe die schwebende GPT-4o-Seite. Für die neuere Familie, auf die die meisten neuen Builds abzielen sollten, siehe GPT-4.1.

Auswahl

Verwenden Sie gpt-4o-2024-05-13, wenn:

Sie ein spezifisches Ergebnis reproduzieren, das an das Launch-Modell gebunden ist.
Ein Compliance-Regime genau diesen Identifier genehmigt hat und eine erneute Genehmigung in Bearbeitung ist.
Ein Forschungs-Workflow das Referenzverhalten vom Mai 2024 erfordert.

Für alles andere wechseln Sie zu einem neueren Snapshot oder zum schwebenden Tag. Der Launch-Snapshot war ein Meilenstein; er ist nicht mehr die richtige Serving-Stufe.

Letzte technische Überprüfung: 2026-05-22 — Tokonomix.ai

Anbieter-VergleichLIVE

Anbieter-Vergleich

Vergleiche jeden Anbieter dieses Modells — Kostenbasis, Qualität, Latenz und Uptime.

Azure OpenAI (EU - Sweden)EU

Eingabekosten✓ beste$2.75

Ausgabekosten$11.00

QualitätNoch nicht getestet

Latenz (p50)Noch nicht getestet

UptimeNoch nicht getestet

Kosten pro 1M Tokens (Kostenbasis)

OpenAIUSDieses Angebot

Eingabekosten$5.00

Ausgabekosten$15.00

Qualität✓ beste100.0

Latenz (p50)✓ beste1,695 ms

UptimeNoch nicht getestet

Kosten pro 1M Tokens (Kostenbasis)

Konsens-Intelligenz

MODELLWEIT

Konsens-Signale sind modellweit — noch nicht pro Anbieter getrennt.

8.0

Agent-Nutzen (1–10)

—

Präzisions-Score

Einzigartige Treffer

Validierte Anfragen

Schweregrad der Funde

■ Hoch 100%■ Mittel 0%■ Niedrig 0%

Community-StimmenLIVE

Community-Stimmen

Was echte Besucher denken — pro Anbieter.

Azure OpenAI (EU - Sweden)EU

Noch keine Community-Stimmen.

OpenAIUS

Noch keine Community-Stimmen.

Mehr Ergebnisse — pro Anbieter

Qualität nach Kategorie

Spiel-Rubrik

Noch keine Daten.

Jury-Urteil

■ OK 94%■ Teilweise 6%■ Falsch 0%

Spiele & Arena

gespielt

Siege

Niederlagen

20.8 ± 7.2

TrueSkill (μ±σ)

Tempo & Gesundheit

1,695 ms

Latenz (p50)

—

Uptime

Qualität nach Kategorie

Spiel-Rubrik

Noch keine Daten.

Jury-Urteil

■ OK 94%■ Teilweise 6%■ Falsch 0%

Spiele & Arena

gespielt

Siege

Niederlagen

20.8 ± 7.2

TrueSkill (μ±σ)

Tempo & Gesundheit

1,695 ms

Latenz (p50)

—

Uptime

Frage & Antwort — durchblätternLIVE

1 von 81

🧠 IntelligenzOpenAImultilingual · 2026-07-26Score: 100

Bir mağazada %20 indirim uygulanıyor. 150 TL olan bir ürün indirimden sonra kaç TL olur?

150 TL olan bir ürüne %20 indirim uygulandığında, önce indirimin ne kadar olduğunu hesaplamamız gerekiyor. %20 indirim, ürünün fiyatının %20'si kadardır. 150 TL'nin %20'si şu şekilde hesaplanır: \[ 150 \, \text{TL} \times \frac{20}{100} = 150 \, \text{TL} \times 0.20 = 30 \, \text{TL} \] İndirim tutarı 30 TL'dir. Bu tutarı 150 TL'den çıkardığımızda indirimli fiyatı buluruz: \[ 150 \, \text{TL} - 30 \, \text{TL} = 120 \, \text{TL} \] Dolayısıyla, 150 TL olan bir ürün indirimden sonra 120 TL olur.

Test-Historie — alle AnbieterLIVE

Qualitätsscore im Zeitverlaufneueste 93

Geschwindigkeit — p50-Latenz im Zeitverlauf

Ein Trend erscheint, sobald dieses Modell an mehreren Tagen getestet wurde.

📝Verdict — ZusammenfassungLIVE

Quality decline and latency increase observed across core performance metrics

🖼️Bild & ErklärungLIVE

gpt-4o-2024-05-13

Fähigkeiten

Warum genau dieses Datum zählt

Was in diesem Snapshot ausgeliefert wird

Sunset-Risiko

Was sich zwischen diesem und späteren Snapshots geändert hat

Pin-Muster

Auswahl

📊Anbieter-VergleichLIVE

🧠Konsens-Intelligenz

👥Community-StimmenLIVE

🔬Mehr Ergebnisse — pro Anbieter

💬Frage & Antwort — durchblätternLIVE

🗂️Test-Historie — alle AnbieterLIVE

Verdict — ZusammenfassungLIVE

Bild & ErklärungLIVE

Anbieter-VergleichLIVE

Konsens-Intelligenz

Community-StimmenLIVE

Mehr Ergebnisse — pro Anbieter

Frage & Antwort — durchblätternLIVE

Test-Historie — alle AnbieterLIVE