
gpt-4o-mini-2024-07-18 est le snapshot daté de juillet 2024 du petit modèle GPT-4o d'OpenAI. Le tout premier gel stable de la ligne mini. Celui qui a été livré quand OpenAI a retiré gpt-3.5-turbo du créneau de modèle économique par défaut et y a installé mini à sa place.
C'est ce que vous épinglez lorsque « gpt-4o-mini » a roulé en avant et a cassé quelque chose pour vous, ou quand un contrat en aval exige le comportement exact de la version originale.
Ce qu'est ce snapshot
Le gel de juillet 2024 est le snapshot mini inaugural. À cette version, le modèle avait :
- Stabilisé la fenêtre de contexte de 128k qui est restée constante sur l'ensemble de la ligne.
- Verrouillé la prise en charge de l'entrée visuelle comme capacité standard plutôt que comme point de terminaison distinct.
- Établi l'ergonomie d'utilisation des outils dont les snapshots mini ultérieurs ont hérité.
Ce qu'il n'a pas, par rapport à l'alias glissant à la mi-2026 :
- Le raffinement du suivi d'instructions que les snapshots mini suivants ont ajouté.
- Les améliorations de fiabilité des sorties structurées qui ont été livrées au fil des révisions de 2025.
- Les ajustements de la posture de refus qui ont gommé l'excès de prudence occasionnel de la version originale.
Pour un déploiement en production qui a été construit et validé contre ce snapshot exact, ces écarts peuvent constituer le mauvais type d'« amélioration » — vous vous êtes stabilisé sur un comportement spécifique, et rouler en avant signifie tout revalider.
Quand l'épingle datée justifie sa place
L'argument pour rester sur 2024-07-18 plutôt que sur l'alias glissant gpt-4o-mini est le même que pour n'importe quel snapshot daté : vous échangez l'accès aux améliorations contre la prévisibilité comportementale.
Situations concrètes où l'épingle paye :
- Charges de travail réglementées avec preuves de version de modèle dans la piste d'audit. Le responsable conformité veut demain le même comportement de modèle que celui que la documentation décrit aujourd'hui. Le snapshot daté est ce qui rend cette promesse honnête.
- Pipelines de production avec des gabarits de prompts ajustés à des particularités spécifiques du modèle. Les snapshots plus récents peuvent traiter le même prompt légèrement différemment — meilleur en moyenne, pire sur les cas limites pour lesquels vos prompts ont été ajustés.
- Tests A/B à long terme où le bras de contrôle doit rester constant pendant des mois.
- Produits orientés client où la cohérence du ton et du langage de refus importe davantage que les gains qualitatifs incrémentaux.
Pour la plupart des autres cas d'usage, suivre l'alias est le meilleur choix par défaut.
Quand migrer
Le chemin de migration honnête va vers l'avant — vers un snapshot mini plus récent ou vers un modèle entièrement différent.
La forme de la décision :
- Relancez la suite d'évaluation complète contre l'alias glissant actuel et contre le snapshot daté le plus récent.
- Comparez sur les métriques qui comptent pour votre produit, pas sur les métriques des notes de version d'OpenAI.
- Migrez quand le nouveau snapshot l'emporte sur votre évaluation. Restez en place quand ce n'est pas le cas.
La politique de dépréciation d'OpenAI donne un préavis avant de retirer les snapshots datés, mais cette politique est le plancher, pas le plafond. Traitez l'épingle datée comme un contrat transitoire, pas comme un foyer permanent.
Là où il échoue
Mêmes contraintes que le reste de la ligne mini.
Raisonnement difficile à la frontière. Mini cède du terrain ici face aux GPT-4o plus grands et à la famille GPT-5. La comparaison au niveau catégorie se trouve sur /benchmarks/leaderboard.
Audio, voix en temps réel ou vidéo. Cela vit sur les variantes spécialisées.
Déploiement auto-hébergé. Pas de poids, pas d'option sur site. L'enquête /usecases/local est la bonne référence quand ces contraintes s'imposent.
Robustesse adversariale. Les petits modèles sont des cibles plus faciles pour l'injection de prompts que les grands. Les modèles de classe mini de tout fournisseur partagent cette faiblesse.
Quand épingler ce snapshot exact
Choisissez gpt-4o-mini-2024-07-18 quand :
- Vous avez livré un produit sur le comportement mini de juillet 2024 et le coût d'une revalidation contre un snapshot plus récent l'emporte sur le bénéfice.
- Un workflow réglementé exige l'épinglage de version au niveau du modèle à des fins d'audit.
- Un test A/B ou un protocole de recherche a besoin d'une référence de modèle fixe dans le temps.
Passez votre chemin quand :
- Vous démarrez de zéro — épinglez plutôt le snapshot mini le plus récent.
- Les améliorations des snapshots ultérieurs l'ont démontrablement emporté sur votre harnais d'évaluation.
- Le déploiement peut tolérer l'alias glissant et bénéficie des mises à niveau automatiques.
Notes de déploiement
API Chat Completions standard. Le comportement d'utilisation des outils et des sorties structurées est inchangé par rapport à ce qu'il était le jour où le snapshot a été gelé. L'entrée visuelle fonctionne de manière identique sur tous les snapshots mini.
Le fine-tuning hébergé est pris en charge, ce qui fait de ce snapshot une base raisonnable pour une variante mini affinée si vous avez besoin d'une qualité de domaine étroit sans payer les coûts d'inférence de la frontière.
La lecture pragmatique. C'est le premier gel stable de la ligne mini. Continuez à l'utiliser quand la stabilité comportementale est la priorité. Passez à un snapshot plus récent quand votre évaluation vous le dit, pas parce qu'OpenAI a publié une note de version. Comparez côte à côte sur /live-test avant toute migration.
Dernière revue technique : 2026-05-22 — Tokonomix.ai
