Zum Inhalt
Tier C — Spezialist
Läuft in:USErstellt in:United States
OpenAI

gpt-4o-2024-11-20

Tier C — Spezialist

Tokonomix-Redaktionsteam·Geprüft von Mes Kalkan··

GPT-4o-2024-11-20 ist ein großes Sprachmodell von OpenAI, das im November 2024 als Teil der GPT-4o-Reihe veröffentlicht wurde. Es stellt eine Weiterentwicklung der multimodalen Architektur von OpenAI dar, wird in dieser Konfiguration jedoch primär für klassische Textgenerierungsaufgaben eingesetzt. Das Modell ist für allgemeines Sprachverständnis und Sprachgenerierung konzipiert, einschließlich Anwendungsfällen wie Inhaltserstellung, Beantwortung von Fragen, Code-Generierung, Analysen und dialogbasierten Anwendungen. Das Modell baut auf der GPT-4-Architektur auf, mit Verbesserungen zur Optimierung von Antwortqualität, Kohärenz und Instruktionsbefolgung. Während OpenAI konkrete technische Details zu Parameteranzahl und Trainingsdaten nicht offenlegt, zeigt das Modell Leistungsmerkmale, die mit Frontier-Class-Sprachmodellen vergleichbar sind. Es verarbeitet Texteingaben und erzeugt Textausgaben mit Fähigkeiten über mehrere Sprachen und Wissensdomänen hinweg, mit einem Trainingsdaten-Stichtag Mitte 2023. Innerhalb der Modellpalette von OpenAI positioniert sich GPT-4o-2024-11-20 als Standardangebot der GPT-4o-Familie, angesiedelt zwischen den früheren GPT-4-Modellen und neueren OpenAI-Releases. Das „o" in GPT-4o steht für Optimierungen im Hinblick auf praktische Einsatzszenarien. Dieser spezifische Snapshot dokumentiert den Stand des Modells zum Veröffentlichungsdatum im November 2024 und gilt als OpenAI-Empfehlung für Allzweckanwendungen, die zuverlässige Textgenerierung ohne spezialisierte multimodale Verarbeitungsanforderungen erfordern.

GPT-4o-Snapshot November 2024: Anthropics allgemeines Flaggschiffmodell in einer stabilen Herbst-2024-Version.

Tokonomix-Benchmark-Zusammenfassung
Abschnitt 01

Qualitätswerte

Auswertungsergebnisse aus Judge-Model-Bewertungen über verschiedene Aufgabenkategorien. Werte spiegeln Kohärenz, Genauigkeit und Anweisungsbefolgung wider.

100
Codegenerierung
99
Mehrsprachig
100
Schlussfolgern
Abschnitt 02

Preisverlauf

Direkte Provider-Tarife pro Million Tokens, plus eine typische Gesprächskostenschätzung.

💰
API-Tarife — gpt-4o-2024-11-20
$2.50 pro 1M Input-Tokens
$10.00 pro 1M Output-Tokens
≈ $0.0035 pro typischem Gespräch (800 Tokens)
Input- vs. Output-Preis (pro 1M Tokens)
pro 1M Input-Tokens$2.50
pro 1M Output-Tokens$10.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.50

input / 1M

— stable

$10.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Abschnitt 03

Stärken & Schwächen

Basierend auf Benchmark-Ergebnissen und aggregiertem Community-Feedback zu realen Anwendungsfällen.

Stärken

Versionierter stabiler SnapshotBreite TextgenerierungsfähigkeitenCode-Generierung und DebuggingMehrsprachige VerarbeitungAnalyse und ZusammenfassungOpenAI-API-Integration

Schwächen

Wissensstatus bis Mitte 2023Kontextgröße nicht dokumentiertKein nativer Audio-Input
Abschnitt 04

Fähigkeiten

toolssource: litellmvisionjson modepdf inputjson schemaparallel toolsprompt cachingmax output tokens: 16384
Abschnitt 05

Häufig gestellte Fragen

Er dokumentiert den Zustand des Modells vom November 2024 und bietet konsistentes Verhalten für bestehende Produktionsintegrationen.

Für Produktionssysteme, die zuverlässige Versionsgarantien brauchen, ist der November-2024-Snapshot eine solide Wahl.

Tokonomix-Benchmark-Zusammenfassung
Abschnitt 06

Verfügbarkeit

Verfügbarkeit

Noch keine Messdaten

Es wurden noch nicht genug API-Aufrufe aufgezeichnet, um Verfügbarkeitsstatistiken für dieses Modell anzuzeigen. Daten erscheinen, sobald das Modell Live-Traffic erhält.

Abschnitt 07

Tokonomix-Benchmark-Urteile

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-595/100 · 76 runs
72 correct4 partial0 wrong95% accuracy
2026-06-14

Comprehensive feature set maintained with stable core capabilities

The gpt-4o-2024-11-20 release maintains the comprehensive capability expansion introduced in the previous window, continuing to support tools, vision, JSON mode, PDF input, JSON schema, parallel tools, and prompt caching. All previously added features remain stable and functional in this iteration. The model continues to offer a robust multi-modal platform suitable for complex enterprise applications requiring structured outputs, document processing, and visual understanding. No new capabilities have been added in this benchmark window, and no existing features have been removed or degraded. Users can expect consistent behavior across all supported modalities. The stability of this release suggests a focus on refinement and reliability rather than feature expansion. Organizations already using the previous version should find migration straightforward with minimal adaptation required. The maintained feature set positions this model as a mature option for production workloads requiring vision understanding, tool use, and structured data handling. This release represents a consolidation period following the significant capability additions of the prior window.

Quality

Latency p50

Test runs

0

All capabilities maintained stable Feature parity with previous release
Abschnitt 08

Vollständiges Modellprofil

gpt-4o-2024-11-20 — illustration 1
gpt-4o-2024-11-20: der späte 4o-Snapshot von Ende 2024

gpt-4o-2024-11-20 ist der letzte größere Snapshot von GPT-4o, den OpenAI vor dem Erscheinen der GPT-4.1-Familie veröffentlicht hat. Am 20. November 2024 freigegeben, repräsentiert er das Modell in seiner ausgereiften Form — dieselbe multimodale Oberfläche wie das Launch-Modell, ergänzt um die Verbesserungen bei Reasoning, Schreibqualität und Refusal-Kalibrierung, die in der zweiten Hälfte 2024 eingeflossen sind.

Für Teams, die 4o weiterhin in Produktion betreiben, ist dies in der Regel der richtige Pin. Für neue Projekte hat sich die Diskussion weiterbewegt.

Was das November-Release verändert hat

Der Snapshot vom August 2024 erhielt die meiste strukturelle Aufmerksamkeit, weil er strikte Structured Outputs mitbrachte. Das November-Release war eine ruhigere Reihe von Änderungen, die in der Produktion jedoch genauso wichtig waren.

Reasoning-Qualität. Der November-Snapshot ist bei mehrstufigen Prompts sichtbar stärker als sowohl das Launch-Modell als auch der August-Snapshot. Chain-of-Thought-artige Arbeiten, Planungs-Prompts, neuartige Code-Synthese aus einer vagen Spezifikation — alle zeigen messbare Verbesserungen. Das Modell erreicht nicht das Niveau der Reasoning-optimierten Nachfolger aus der GPT-5-Familie, aber für die 4o-Klasse war es der Höhepunkt.

Schreibqualität. Langtext-Prosa aus diesem Snapshot ist spürbar weniger steif als aus dem August-Release. Die Satzstruktur variiert stärker, das Modell schränkt seltener ein, wenn der Prompt keine Einschränkungen rechtfertigt, und das Register bleibt über Absätze hinweg konsistenter. Teams, die Blog-Drafting, Executive-Summary-Arbeit oder beliebige produktive Textgenerierung auf 4o betreiben, pinnen schon allein deshalb auf diesen Snapshot.

Refusal-Kalibrierung. Etwas weniger aggressiv als August bei Grenzfällen. Einige legitime Edge-Case-Anfragen, die der August-Snapshot ablehnte, gehen im November sauber durch.

Was im Snapshot enthalten ist

Die vollständige GPT-4o-Feature-Oberfläche, wie sie im November 2024 vorlag. Text- und Bildeingabe mit einem 128k-Token-Kontextfenster. Audio über die Realtime-API und zeitgenössische Endpoints. Strikte Structured Outputs, übernommen aus August. JSON-Modus. Function Calling. Streaming auf der Chat-Completions-Oberfläche.

Was in diesem Snapshot nicht enthalten ist, ist alles aus der GPT-4.1-Familie. Der Million-Token-Kontext, die weiteren Reasoning-Verbesserungen, das aktualisierte Tokenizer-Handling — alles bleibt der neueren Familie vorbehalten. Wenn Ihr Workload tatsächlich davon profitiert, dreht sich die Upgrade-Diskussion um die Modellfamilie und nicht nur um das Snapshot-Datum.

Warum Teams gezielt auf November pinnen

Die meisten 4o-Pins, die heute in Produktion laufen, landen auf diesem Datum oder auf dem Floating Tag. Die Gründe sind die üblichen.

Compliance-Regime, die diesen Identifier freigegeben haben. Der November-Snapshot ist neu genug, dass abgeschlossene Audit-Zyklen gegen ihn weiterhin relevant sind, was ihn zum am häufigsten freigegebenen gepinnten 4o in regulierten Umgebungen macht.

Downstream-Pipelines, die auf das November-Verhalten abgestimmt sind. Teams, die rund um die Schreib- oder Reasoning-Qualität dieses Snapshots gebaut haben — Content-Generierung, Summarisierungsdienste, Agent-Loops, die von den spezifischen Entscheidungsmustern aus dem November abhängen — pinnen, um dieses Verhalten festzuhalten.

Verschobene Migration. Für Teams, die den Umstieg auf GPT-4.1 oder GPT-5 noch nicht abgeschlossen haben, bietet das Pinnen auf November ein stabiles Ziel, während die Migrationsarbeit läuft. In Produktion zu floaten, während migriert wird, ist ein Rezept für bewegliche Ziele in den Eval-Reports.

Wie es im Vergleich zum aktuellen Stand des Feldes abschneidet

GPT-4o auf dem November-Snapshot liegt nicht mehr an der Spitze. GPT-4.1, GPT-5 sowie die Claude-Opus-4.x- und Gemini-3-Pro-Familien sind bei Reasoning, Long-Context-Arbeit und Structured-Output-Edge-Cases klar voraus.

Was 4o weiterhin auszeichnet, ist eine gut verstandene Deployment-Geschichte, ein Preispunkt, der freundlicher ist als die Frontier-Stufe, und eine Audio-Oberfläche über gpt-4o-audio und die Realtime-API, die kein Nachfolger für produktive Voice-Arbeit vollständig ersetzt hat.

Für den kategorieübergreifenden Vergleich siehe /benchmarks/leaderboard. Aufschlüsselungen zu Geschwindigkeit und Intelligenz unter /benchmarks/speed und /benchmarks/intelligence.

Sunset-Risiko

Dieser Snapshot ist der jüngste 4o-Pin und damit am weitesten vom Sunset entfernt, aber der Deprecation-Horizont ist endlich. Der typische Zwölf- bis Achtzehn-Monats-Zyklus von OpenAI gilt. Planen Sie entsprechend.

Der natürliche Nachfolger auf der 4o-Familienseite ist der Floating Tag, der das meiste Verhalten aus dem November mit den kleinen darauffolgenden Verbesserungen weiterführt. Der vorausschauende Schritt ist der Umstieg auf GPT-4.1 oder GPT-5, je nach Workload. Halten Sie den Eval-Zyklus bereit, bevor das Deprecation-Datum angekündigt wird.

Pin-Muster

Das Muster, das sich bewährt:

  • In Eval, CI und auditierten Workflows pinnen.
  • Im Produktions-Traffic floaten, wo die kleinen laufenden Verbesserungen mehr wert sind als Reproduzierbarkeit.
  • Wöchentlich zwischen gepinntem und floatendem Modell gegen ein festes Prompt-Set diffen, um Verhaltensdrift zu erkennen.

Speziell für November ist die Drift des Floating Tags gegenüber diesem Snapshot heute klein genug, dass der Diff oft sauber zurückkommt. Das ändert sich mit der Zeit; lassen Sie den Diff-Job nicht aus dem Kalender fallen.

Für die floatende 4o-Oberfläche siehe GPT-4o. Für die Familie, die 4o für neue Projekte ablöst, siehe GPT-4.1.

Auswahl

Verwenden Sie gpt-4o-2024-11-20, wenn:

  • Ein Compliance-Regime diesen Identifier freigegeben hat und Ihr jüngster Audit-Zyklus ist.
  • Downstream-Pipelines von der Schreib- oder Reasoning-Qualität dieses spezifischen Releases abhängen.
  • Sie 4o in Produktion betreiben und einen stabilen Pin wollen, während eine Migration zu GPT-4.1 läuft.

Für neue Projekte zielen Sie auf die neuere Familie. November war ein guter Landeplatz. Er steht nicht mehr an der Spitze der Reihe.

Letzte technische Prüfung: 2026-05-22 — Tokonomix.ai

gpt-4o-2024-11-20 — illustration 2
Letzter automatisierter Test
14. Juni 2026 · 05:06 UTC · Benchmark
P50-Latenz
1326 ms
P95-Latenz
Fehler
0 / 6 Läufe
Zuletzt geprüft von Tokonomix-Team·26. Mai 2026