Tier C — Spezialist

Läuft in:USErstellt in:United States

$0.6000

Ausgabe · pro 1M Tokens (Kostenbasis)

Kosten

1,097 ms

Antwortgeschwindigkeit

100 / 100

Intelligenz

Verdict — ZusammenfassungLIVE

● LIVE

jetzt · 2026-07-26

Eighth window: Capability expansion with tools, vision, and structured outputs

✓ Tool calling support added✓ Vision input now supported✓ JSON schema structured outputs✓ PDF processing capability added

GPT-4o Mini enters its eighth benchmark window with significant capability additions while maintaining its core identity as a compact model. The most notable changes include the introduction of tool calling, vision input processing, and advanced structured output modes including JSON schema support and parallel tool execution. PDF input capability has also been added, expanding the model's document processing range. Prompt caching support suggests infrastructure optimizations for repeated context handling. These additions transform the model from a text-only processor into a multimodal assistant capable of handling diverse input types and producing structured outputs. The benchmark data shows no performance metrics for this window, making it impossible to assess whether these new capabilities come with any trade-offs in speed, accuracy, or other measurable attributes. Users gain access to a substantially more versatile model that can now participate in tool-augmented workflows and process visual information alongside text. The lack of comparative performance data means adopters should conduct their own testing to understand how these capabilities perform in production scenarios and whether they meet specific application requirements.

Quality

—

Latency p50

—

Test runs

1 von 18

Bild & ErklärungLIVE

OpenAI

gpt-4o-mini-2024-07-18

Tier C — Spezialist

Tokonomix-Redaktionsteam·Geprüft von Mes Kalkan·Veröffentlicht 22. Mai 2026·Zuletzt geprüft 26. Mai 2026

GPT-4o-mini-2024-07-18 ist ein kompaktes Sprachmodell von OpenAI, das im Juli 2024 als Teil der GPT-4o-Modellfamilie veröffentlicht wurde. Es stellt eine kleinere, effizientere Variante der GPT-4o-Architektur dar und wurde entwickelt, um leistungsfähige Textgenerierung bei geringerem Rechenaufwand als die größeren Pendants zu ermöglichen. Das Modell behält die multimodale Architekturbasis der GPT-4o-Reihe bei, konzentriert sich in dieser Variante jedoch vorrangig auf textbasierte Aufgaben. Das Modell ist für Anwendungen konzipiert, die Standardfunktionen zur Textgenerierung bei reduzierter Latenz und geringerem Ressourcenbedarf erfordern. Es bewältigt Aufgaben wie Inhaltserstellung, Fragebeantwortung, Zusammenfassung, Codegenerierung und dialogbasierte Interaktionen. Die Bezeichnung „mini" weist auf seine Positionierung als leichtgewichtige Option hin, die für Anwendungsfälle geeignet ist, in denen die vollständigen Fähigkeiten größerer Modelle nicht zwingend erforderlich sind – also für Anwendungen mit hohem Volumen oder Einsatzszenarien mit Ressourcenbeschränkungen. Innerhalb des Modellportfolios von OpenAI ist GPT-4o-mini hinsichtlich Leistungsfähigkeit und Kapazität unterhalb der Flaggschiffmodelle GPT-4o und GPT-4 Turbo angesiedelt und bietet eine Balance zwischen Leistung und Effizienz. Es löste frühere kompakte Modelle im Portfolio von OpenAI ab und bietet verbesserte Leistungsmerkmale gegenüber GPT-3.5-basierten Alternativen, bleibt dabei jedoch für ein breiteres Anwendungsspektrum zugänglich. Das Modell steht für OpenAIs fortlaufende Bemühungen, vielfältige Optionen über unterschiedliche Leistungs- und Effizienzprofile hinweg bereitzustellen.

gpt-4o-mini-2024-07-18 mit eigenen Fragen testen

GPT-4o-mini positioniert sich als pragmatische Arbeitsmaschine für Anwendungen, bei denen Durchsatz und Antwortlatenz wichtiger sind als die volle Modelltiefe der Flaggschiff-Varianten.
— Tokonomix Redaktionsnotiz

Fähigkeiten

toolssource: litellmvisionjson modepdf inputjson schemaparallel toolsprompt cachingmax output tokens: 16384

gpt-4o-mini-2024-07-18: der ursprüngliche Mini-Freeze

gpt-4o-mini-2024-07-18 ist der datierte Snapshot vom Juli 2024 des kleinen GPT-4o-Modells von OpenAI. Der erste stabile Freeze der Mini-Linie. Derjenige, der ausgeliefert wurde, als OpenAI gpt-3.5-turbo aus dem Standard-Slot für günstige Modelle zurückgezogen und Mini an dessen Stelle gesetzt hat.

Das ist der Snapshot, den man pinnt, wenn "gpt-4o-mini" weitergerollt ist und dabei etwas bei Ihnen kaputtgemacht hat, oder wenn ein nachgelagerter Vertrag exakt das Verhalten des ursprünglichen Releases verlangt.

Was dieser Snapshot ist

Der Freeze vom Juli 2024 ist der erste Mini-Snapshot überhaupt. Mit diesem Release hatte das Modell:

Das 128k-Kontextfenster festgelegt, das über die gesamte Linie hinweg konstant geblieben ist.
Vision-Input-Unterstützung als Standardfähigkeit verankert, statt sie als separaten Endpunkt zu führen.
Die Tool-Use-Ergonomie etabliert, die spätere Mini-Snapshots geerbt haben.

Was er im Vergleich zum rollenden Alias mit Stand Mitte 2026 nicht hat:

Den Feinschliff beim Instruction-Following, den nachfolgende Mini-Snapshots ergänzt haben.
Die Verbesserungen bei der Zuverlässigkeit strukturierter Ausgaben, die über die Revisionen im Jahr 2025 hinweg eingeflossen sind.
Die Verfeinerungen der Refusal-Haltung, die die gelegentliche Übervorsicht des Ursprungsreleases geglättet haben.

Für ein Produktionsdeployment, das gegen genau diesen Snapshot gebaut und validiert wurde, können diese Lücken die falsche Art von "Verbesserung" sein — Sie haben sich auf spezifisches Verhalten stabilisiert, und ein Vorwärtsrollen bedeutet, alles erneut zu validieren.

Wann sich das datierte Pinning lohnt

Das Argument, beim 2024-07-18 zu bleiben statt beim rollenden gpt-4o-mini-Alias, ist dasselbe wie bei jedem datierten Snapshot: Sie tauschen Zugriff auf Verbesserungen gegen Verhaltensvorhersagbarkeit.

Konkrete Situationen, in denen sich das Pinning auszahlt:

Regulierte Workloads mit Modellversionsnachweis im Audit-Trail. Der Compliance-Verantwortliche möchte morgen dasselbe Modellverhalten, das die Dokumentation heute beschreibt. Der datierte Snapshot ist das, was dieses Versprechen ehrlich macht.
Produktions-Pipelines mit Prompt-Templates, die auf spezifische Modell-Eigenheiten abgestimmt sind. Neuere Snapshots verarbeiten denselben Prompt möglicherweise leicht anders — im Durchschnitt besser, in den Edge Cases, auf die Ihre Prompts getuned wurden, schlechter.
Langlaufende A/B-Tests, bei denen der Kontrollarm über Monate konstant bleiben muss.
Kundenseitige Produkte, bei denen die Konsistenz von Tonalität und Refusal-Sprache wichtiger ist als inkrementelle Qualitätsgewinne.

Für die meisten anderen Anwendungsfälle ist das Mitlaufen mit dem Alias die bessere Standardentscheidung.

Wann man weg migrieren sollte

Der ehrliche Migrationspfad ist nach vorn — zu einem aktuelleren Mini-Snapshot oder zu einem ganz anderen Modell.

So sieht die Entscheidung aus:

Die vollständige Evaluations-Suite gegen den aktuellen rollenden Alias und gegen den jüngsten datierten Snapshot erneut ausführen.
Anhand der Metriken vergleichen, die für Ihr Produkt zählen, nicht anhand der Metriken aus OpenAIs Release Notes.
Migrieren, wenn der neuere Snapshot in Ihrer Evaluation gewinnt. Bleiben, wenn nicht.

OpenAIs Deprecation-Policy gibt eine Vorankündigung, bevor datierte Snapshots zurückgezogen werden, aber diese Policy ist die Untergrenze, nicht die Obergrenze. Behandeln Sie das datierte Pinning als Übergangsvertrag, nicht als dauerhafte Heimat.

Wo das Modell auf der Strecke bleibt

Dieselben Beschränkungen wie für den Rest der Mini-Linie.

Hartes Reasoning an der Spitze. Mini muss hier Boden gegen das größere GPT-4o und die GPT-5-Familie abgeben. Der Vergleich auf Kategorieebene findet sich unter /benchmarks/leaderboard.

Audio, Echtzeit-Stimme oder Video. Das ist die Domäne der spezialisierten Geschwistermodelle.

Self-hosted-Deployment. Keine Weights, keine On-Prem-Option. Die Übersicht unter /usecases/local ist die richtige Referenz, wenn diese Anforderungen greifen.

Robustheit gegen Angriffe. Kleine Modelle sind leichtere Ziele für Prompt Injection als große. Mini-Klasse-Modelle jedes Anbieters teilen sich diese Schwäche.

Wann genau diesen Snapshot pinnen

Wählen Sie gpt-4o-mini-2024-07-18, wenn:

Sie ein Produkt auf dem Mini-Verhalten vom Juli 2024 ausgeliefert haben und die Kosten einer erneuten Validierung gegen einen neueren Snapshot den Nutzen überwiegen.
Ein regulierter Workflow das Version-Pinning auf Modellebene zu Auditzwecken vorschreibt.
Ein A/B-Test oder Forschungsprotokoll eine über die Zeit fixierte Modellreferenz benötigt.

Verzichten Sie darauf, wenn:

Sie neu starten — pinnen Sie stattdessen den jüngsten Mini-Snapshot.
Die Verbesserungen späterer Snapshots in Ihrem Evaluations-Harness nachweislich gewinnen.
Das Deployment den rollenden Alias verträgt und von automatischen Upgrades profitiert.

Deployment-Hinweise

Standard-Chat-Completions-API. Das Verhalten von Tool-Use und strukturierter Ausgabe ist unverändert seit dem Tag, an dem der Snapshot eingefroren wurde. Vision-Input funktioniert über alle Mini-Snapshots hinweg identisch.

Hosted Fine-Tuning wird unterstützt, was diesen Snapshot zu einer vernünftigen Basis für eine feinabgestimmte Mini-Variante macht, wenn Sie Qualität in einem engen Fachgebiet brauchen, ohne die Inferenzkosten der Frontier-Modelle zu bezahlen.

Die pragmatische Lesart. Das ist der erste stabile Freeze der Mini-Linie. Nutzen Sie ihn weiter, wenn Verhaltensstabilität Priorität hat. Wechseln Sie zu einem neueren Snapshot, wenn Ihre Evaluation es Ihnen sagt — nicht weil OpenAI eine Release Note veröffentlicht hat. Vergleichen Sie unter /live-test Seite an Seite, bevor Sie migrieren.

Letzte technische Prüfung: 22.05.2026 — Tokonomix.ai

Anbieter-VergleichLIVE

Anbieter-Vergleich

Vergleiche jeden Anbieter dieses Modells — Kostenbasis, Qualität, Latenz und Uptime.

Azure OpenAI (EU - Sweden)EU

Eingabekosten$0.1600

Ausgabekosten$0.6600

QualitätNoch nicht getestet

Latenz (p50)Noch nicht getestet

UptimeNoch nicht getestet

Kosten pro 1M Tokens (Kostenbasis)

OpenAIUSDieses Angebot

Eingabekosten✓ beste$0.1500

Ausgabekosten$0.6000

Qualität✓ beste100.0

Latenz (p50)✓ beste1,097 ms

UptimeNoch nicht getestet

Kosten pro 1M Tokens (Kostenbasis)

Konsens-Intelligenz

MODELLWEITDORMANT

Konsens-Signale sind modellweit — noch nicht pro Anbieter getrennt.

Konsens-Scoring sammelt noch Daten für dieses Modell — noch keine Signale.

Community-StimmenLIVE

Community-Stimmen

Was echte Besucher denken — pro Anbieter.

Azure OpenAI (EU - Sweden)EU

Noch keine Community-Stimmen.

OpenAIUS

Noch keine Community-Stimmen.

Mehr Ergebnisse — pro Anbieter

Qualität nach Kategorie

Spiel-Rubrik

Noch keine Daten.

Jury-Urteil

■ OK 80%■ Teilweise 12%■ Falsch 8%

Spiele & Arena

Noch keine Daten.

Tempo & Gesundheit

1,097 ms

Latenz (p50)

—

Uptime

Qualität nach Kategorie

Spiel-Rubrik

Noch keine Daten.

Jury-Urteil

■ OK 80%■ Teilweise 12%■ Falsch 8%

Spiele & Arena

Noch keine Daten.

Tempo & Gesundheit

1,097 ms

Latenz (p50)

—

Uptime

Frage & Antwort — durchblätternLIVE

1 von 80

🧠 IntelligenzOpenAImultilingual · 2026-07-26Score: 100

Bir mağazada %20 indirim uygulanıyor. 150 TL olan bir ürün indirimden sonra kaç TL olur?

150 TL olan bir üründe %20 indirim uygulanırsa, indirim miktarını hesaplayalım: İndirim miktarı = 150 TL * %20 = 150 TL * 0.20 = 30 TL Bu durumda, indirim sonrası ürünün fiyatı: 150 TL - 30 TL = 120 TL Sonuç olarak, indirimden sonra ürün 120 TL olur.

Test-Historie — alle AnbieterLIVE

Qualitätsscore im Zeitverlaufneueste 78

Geschwindigkeit — p50-Latenz im Zeitverlauf

Ein Trend erscheint, sobald dieses Modell an mehreren Tagen getestet wurde.

📝Verdict — ZusammenfassungLIVE

Eighth window: Capability expansion with tools, vision, and structured outputs

🖼️Bild & ErklärungLIVE

gpt-4o-mini-2024-07-18

Fähigkeiten

Was dieser Snapshot ist

Wann sich das datierte Pinning lohnt

Wann man weg migrieren sollte

Wo das Modell auf der Strecke bleibt

Wann genau diesen Snapshot pinnen

Deployment-Hinweise

📊Anbieter-VergleichLIVE

🧠Konsens-Intelligenz

👥Community-StimmenLIVE

🔬Mehr Ergebnisse — pro Anbieter

💬Frage & Antwort — durchblätternLIVE

🗂️Test-Historie — alle AnbieterLIVE

Verdict — ZusammenfassungLIVE

Bild & ErklärungLIVE

Anbieter-VergleichLIVE

Konsens-Intelligenz

Community-StimmenLIVE

Mehr Ergebnisse — pro Anbieter

Frage & Antwort — durchblätternLIVE

Test-Historie — alle AnbieterLIVE