Tier C — Spécialiste

Fonctionne en :USCréé en :United States

$0.6000

sortie · par 1M de tokens (coût de base)

Coût

1,097 ms

Vitesse de réponse

100 / 100

Intelligence

Verdict — résuméLIVE

● LIVE

maintenant · 2026-07-26

Eighth window: Capability expansion with tools, vision, and structured outputs

✓ Tool calling support added✓ Vision input now supported✓ JSON schema structured outputs✓ PDF processing capability added

GPT-4o Mini enters its eighth benchmark window with significant capability additions while maintaining its core identity as a compact model. The most notable changes include the introduction of tool calling, vision input processing, and advanced structured output modes including JSON schema support and parallel tool execution. PDF input capability has also been added, expanding the model's document processing range. Prompt caching support suggests infrastructure optimizations for repeated context handling. These additions transform the model from a text-only processor into a multimodal assistant capable of handling diverse input types and producing structured outputs. The benchmark data shows no performance metrics for this window, making it impossible to assess whether these new capabilities come with any trade-offs in speed, accuracy, or other measurable attributes. Users gain access to a substantially more versatile model that can now participate in tool-augmented workflows and process visual information alongside text. The lack of comparative performance data means adopters should conduct their own testing to understand how these capabilities perform in production scenarios and whether they meet specific application requirements.

Quality

—

Latency p50

—

Test runs

1 sur 18

Image et explicationLIVE

OpenAI

gpt-4o-mini-2024-07-18

Tier C — Spécialiste

Équipe éditoriale Tokonomix·Relu par Mes Kalkan·Publié le 22 mai 2026·Dernière relecture 26 mai 2026

GPT-4o-mini-2024-07-18 est un modèle de langage compact développé par OpenAI, publié en juillet 2024 dans le cadre de la famille de modèles GPT-4o. Il représente une variante plus petite et plus efficiente de l'architecture GPT-4o, conçue pour offrir une génération de texte performante tout en nécessitant moins de ressources computationnelles que ses homologues plus volumineux. Le modèle conserve la base architecturale multimodale de la série GPT-4o, bien que cette variante se concentre principalement sur les tâches textuelles. Ce modèle est conçu pour les applications nécessitant des capacités standard de génération de texte avec une latence et des exigences en ressources réduites. Il gère des tâches telles que la création de contenu, les réponses aux questions, la synthèse, la génération de code et les interactions conversationnelles. La désignation "mini" indique sa position comme option allégée adaptée aux cas d'usage où les capacités complètes de modèles plus grands peuvent ne pas être nécessaires, le rendant approprié pour les applications à fort volume ou les scénarios de déploiement avec contraintes de ressources. Au sein de la gamme de modèles OpenAI, GPT-4o-mini se situe en dessous des modèles phares GPT-4o et GPT-4 Turbo en termes de capacité, offrant un équilibre entre performance et efficience. Il a succédé aux modèles compacts antérieurs du portefeuille OpenAI, fournissant des caractéristiques de performance améliorées par rapport aux alternatives basées sur GPT-3.5 tout en maintenant l'accessibilité pour un éventail plus large d'applications. Le modèle représente l'effort continu d'OpenAI pour proposer des options variées selon différents profils de performance et d'efficience.

Testez gpt-4o-mini-2024-07-18 avec vos propres questions

GPT-4o-mini occupe le créneau du modèle compact polyvalent d'OpenAI, pensé pour les charges à fort volume où la latence et l'efficacité priment sur la puissance brute.
— Synthèse éditoriale Tokonomix

Capacités

toolssource: litellmvisionjson modepdf inputjson schemaparallel toolsprompt cachingmax output tokens: 16384

gpt-4o-mini-2024-07-18 : le gel originel de la ligne mini

gpt-4o-mini-2024-07-18 est le snapshot daté de juillet 2024 du petit modèle GPT-4o d'OpenAI. Le tout premier gel stable de la ligne mini. Celui qui a été livré quand OpenAI a retiré gpt-3.5-turbo du créneau de modèle économique par défaut et y a installé mini à sa place.

C'est ce que vous épinglez lorsque « gpt-4o-mini » a roulé en avant et a cassé quelque chose pour vous, ou quand un contrat en aval exige le comportement exact de la version originale.

Ce qu'est ce snapshot

Le gel de juillet 2024 est le snapshot mini inaugural. À cette version, le modèle avait :

Stabilisé la fenêtre de contexte de 128k qui est restée constante sur l'ensemble de la ligne.
Verrouillé la prise en charge de l'entrée visuelle comme capacité standard plutôt que comme point de terminaison distinct.
Établi l'ergonomie d'utilisation des outils dont les snapshots mini ultérieurs ont hérité.

Ce qu'il n'a pas, par rapport à l'alias glissant à la mi-2026 :

Le raffinement du suivi d'instructions que les snapshots mini suivants ont ajouté.
Les améliorations de fiabilité des sorties structurées qui ont été livrées au fil des révisions de 2025.
Les ajustements de la posture de refus qui ont gommé l'excès de prudence occasionnel de la version originale.

Pour un déploiement en production qui a été construit et validé contre ce snapshot exact, ces écarts peuvent constituer le mauvais type d'« amélioration » — vous vous êtes stabilisé sur un comportement spécifique, et rouler en avant signifie tout revalider.

Quand l'épingle datée justifie sa place

L'argument pour rester sur 2024-07-18 plutôt que sur l'alias glissant gpt-4o-mini est le même que pour n'importe quel snapshot daté : vous échangez l'accès aux améliorations contre la prévisibilité comportementale.

Situations concrètes où l'épingle paye :

Charges de travail réglementées avec preuves de version de modèle dans la piste d'audit. Le responsable conformité veut demain le même comportement de modèle que celui que la documentation décrit aujourd'hui. Le snapshot daté est ce qui rend cette promesse honnête.
Pipelines de production avec des gabarits de prompts ajustés à des particularités spécifiques du modèle. Les snapshots plus récents peuvent traiter le même prompt légèrement différemment — meilleur en moyenne, pire sur les cas limites pour lesquels vos prompts ont été ajustés.
Tests A/B à long terme où le bras de contrôle doit rester constant pendant des mois.
Produits orientés client où la cohérence du ton et du langage de refus importe davantage que les gains qualitatifs incrémentaux.

Pour la plupart des autres cas d'usage, suivre l'alias est le meilleur choix par défaut.

Quand migrer

Le chemin de migration honnête va vers l'avant — vers un snapshot mini plus récent ou vers un modèle entièrement différent.

La forme de la décision :

Relancez la suite d'évaluation complète contre l'alias glissant actuel et contre le snapshot daté le plus récent.
Comparez sur les métriques qui comptent pour votre produit, pas sur les métriques des notes de version d'OpenAI.
Migrez quand le nouveau snapshot l'emporte sur votre évaluation. Restez en place quand ce n'est pas le cas.

La politique de dépréciation d'OpenAI donne un préavis avant de retirer les snapshots datés, mais cette politique est le plancher, pas le plafond. Traitez l'épingle datée comme un contrat transitoire, pas comme un foyer permanent.

Là où il échoue

Mêmes contraintes que le reste de la ligne mini.

Raisonnement difficile à la frontière. Mini cède du terrain ici face aux GPT-4o plus grands et à la famille GPT-5. La comparaison au niveau catégorie se trouve sur /benchmarks/leaderboard.

Audio, voix en temps réel ou vidéo. Cela vit sur les variantes spécialisées.

Déploiement auto-hébergé. Pas de poids, pas d'option sur site. L'enquête /usecases/local est la bonne référence quand ces contraintes s'imposent.

Robustesse adversariale. Les petits modèles sont des cibles plus faciles pour l'injection de prompts que les grands. Les modèles de classe mini de tout fournisseur partagent cette faiblesse.

Quand épingler ce snapshot exact

Choisissez gpt-4o-mini-2024-07-18 quand :

Vous avez livré un produit sur le comportement mini de juillet 2024 et le coût d'une revalidation contre un snapshot plus récent l'emporte sur le bénéfice.
Un workflow réglementé exige l'épinglage de version au niveau du modèle à des fins d'audit.
Un test A/B ou un protocole de recherche a besoin d'une référence de modèle fixe dans le temps.

Passez votre chemin quand :

Vous démarrez de zéro — épinglez plutôt le snapshot mini le plus récent.
Les améliorations des snapshots ultérieurs l'ont démontrablement emporté sur votre harnais d'évaluation.
Le déploiement peut tolérer l'alias glissant et bénéficie des mises à niveau automatiques.

Notes de déploiement

API Chat Completions standard. Le comportement d'utilisation des outils et des sorties structurées est inchangé par rapport à ce qu'il était le jour où le snapshot a été gelé. L'entrée visuelle fonctionne de manière identique sur tous les snapshots mini.

Le fine-tuning hébergé est pris en charge, ce qui fait de ce snapshot une base raisonnable pour une variante mini affinée si vous avez besoin d'une qualité de domaine étroit sans payer les coûts d'inférence de la frontière.

La lecture pragmatique. C'est le premier gel stable de la ligne mini. Continuez à l'utiliser quand la stabilité comportementale est la priorité. Passez à un snapshot plus récent quand votre évaluation vous le dit, pas parce qu'OpenAI a publié une note de version. Comparez côte à côte sur /live-test avant toute migration.

Dernière revue technique : 2026-05-22 — Tokonomix.ai

Comparaison des fournisseursLIVE

Comparaison des fournisseurs

Comparez chaque fournisseur de ce modèle — coût de base, qualité, latence et disponibilité.

Azure OpenAI (EU - Sweden)UE

Coût d’entrée$0.1600

Coût de sortie$0.6600

QualitéPas encore testé

Latence (p50)Pas encore testé

DisponibilitéPas encore testé

Coûts affichés par 1M de tokens (coût de base)

OpenAIUSCette offre

Coût d’entrée✓ meilleur$0.1500

Coût de sortie$0.6000

Qualité✓ meilleur100.0

Latence (p50)✓ meilleur1,097 ms

DisponibilitéPas encore testé

Coûts affichés par 1M de tokens (coût de base)

Intelligence de consensus

MODÈLE ENTIERDORMANT

Les signaux de consensus sont à l’échelle du modèle — pas encore par fournisseur.

Le scoring de consensus collecte encore des données pour ce modèle — aucun signal pour l’instant.

Votes de la communautéLIVE

Votes de la communauté

Ce que pensent les vrais visiteurs — par fournisseur.

Azure OpenAI (EU - Sweden)UE

Pas encore de votes de la communauté.

OpenAIUS

Pas encore de votes de la communauté.

Plus de résultats — par fournisseur

Qualité par catégorie

Grille de jeu

Pas encore de données.

Verdict du juge

■ OK 80%■ Partiel 12%■ Faux 8%

Jeux & arène

Pas encore de données.

Vitesse & santé

1,097 ms

Latence (p50)

—

Disponibilité

Qualité par catégorie

Grille de jeu

Pas encore de données.

Verdict du juge

■ OK 80%■ Partiel 12%■ Faux 8%

Jeux & arène

Pas encore de données.

Vitesse & santé

1,097 ms

Latence (p50)

—

Disponibilité

Question & réponse — parcourirLIVE

1 sur 80

🧠 intelligenceOpenAImultilingual · 2026-07-26score: 100

Bir mağazada %20 indirim uygulanıyor. 150 TL olan bir ürün indirimden sonra kaç TL olur?

150 TL olan bir üründe %20 indirim uygulanırsa, indirim miktarını hesaplayalım: İndirim miktarı = 150 TL * %20 = 150 TL * 0.20 = 30 TL Bu durumda, indirim sonrası ürünün fiyatı: 150 TL - 30 TL = 120 TL Sonuç olarak, indirimden sonra ürün 120 TL olur.

Historique des tests — tous fournisseursLIVE

Score de qualité dans le tempsdernier 78

Vitesse — latence p50 dans le temps

Une tendance apparaît une fois ce modèle testé sur plusieurs jours.

📝Verdict — résuméLIVE

Eighth window: Capability expansion with tools, vision, and structured outputs

🖼️Image et explicationLIVE

gpt-4o-mini-2024-07-18

Capacités

Ce qu'est ce snapshot

Quand l'épingle datée justifie sa place

Quand migrer

Là où il échoue

Quand épingler ce snapshot exact

Notes de déploiement

📊Comparaison des fournisseursLIVE

🧠Intelligence de consensus

👥Votes de la communautéLIVE

🔬Plus de résultats — par fournisseur

💬Question & réponse — parcourirLIVE

🗂️Historique des tests — tous fournisseursLIVE

Verdict — résuméLIVE

Image et explicationLIVE

Comparaison des fournisseursLIVE

Intelligence de consensus

Votes de la communautéLIVE

Plus de résultats — par fournisseur

Question & réponse — parcourirLIVE

Historique des tests — tous fournisseursLIVE