
gpt-4o-2024-05-13 est la version originale de GPT-4o, figée à la date de première disponibilité publique du modèle, le 13 mai 2024. C'est l'ancrage daté du premier modèle multimodal de génération chez OpenAI — celui qui a introduit le comportement unifié texte-vision-audio et redéfini les attentes de la discipline vis-à-vis d'une surface de modèle de frontière.
Pour la plupart des équipes, cet instantané est désormais trop ancien pour être recommandé. Pour le petit ensemble de cas où la reproductibilité face au modèle de lancement compte plus que toute amélioration ultérieure, il reste disponible.
Pourquoi cette date précise compte
Le lancement du 13 mai 2024 est le moment où le multimodal a cessé d'être une démonstration de recherche pour devenir une cible de déploiement. Les variantes antérieures de GPT-4 prenaient en charge la vision, mais la surface audio et la latence réduite sur le texte sont des contributions propres à 4o. Les équipes qui ont déposé des évaluations ou rédigé des contrats fournisseurs en référence au modèle de lancement veulent un point de référence stable ; cet instantané est ce point de référence.
Deux raisons précises de s'intéresser à cette date exacte.
Premièrement, les travaux comparatifs. Les équipes de recherche qui étudient les capacités des modèles d'une génération à l'autre ont besoin d'un modèle qui n'a pas changé silencieusement sous leurs expériences. L'instantané de lancement est le modèle qui a été évalué dans les notes de version originales d'OpenAI et dans la majeure partie des travaux d'évaluation tiers de mi-2024.
Deuxièmement, les déploiements réglementés approuvés sur la base du modèle de lancement. Certains régimes de conformité exigent que tout modèle traitant des données de production ait suivi un cycle d'évaluation spécifique. Si votre auditeur a approuvé la version de mai 2024 et que la migration vers un instantané plus récent n'est pas encore validée, c'est ce modèle que vous exécutez.
Ce que contient cet instantané
Tout ce qu'OpenAI a livré le jour du lancement. Entrée texte et image avec une fenêtre de contexte de 128k tokens. Surfaces audio via les points d'accès contemporains. Mode JSON, mais pas la fonctionnalité ultérieure de sorties structurées — celle-ci est arrivée avec la version du 6 août 2024. Appel de fonctions. Streaming. La surface Chat Completions ; la surface Responses a été ajoutée plus tard et ne fait pas partie du comportement de cet instantané.
Ce qui ne figure pas dans cet instantané, c'est tout ce qui a été introduit dans les versions ultérieures de 4o. La mise à jour du 6 août a ajouté des sorties structurées strictes et resserré le comportement du mode JSON. La mise à jour du 20 novembre a apporté des améliorations en matière de raisonnement et de qualité rédactionnelle. Aucune des deux n'est présente dans l'instantané de mai. Si votre pipeline en aval dépend d'un comportement particulier de sortie structurée, vérifiez sur quel instantané il a été construit avant de supposer que l'ancrage de mai est le bon choix.
Risque de fin de vie
Il s'agit du plus ancien instantané de 4o encore régulièrement disponible, ce qui signifie qu'il est le plus proche de sa date de fin de vie. L'horizon typique de dépréciation d'OpenAI pour les instantanés datés se situe entre douze et dix-huit mois après leur sortie. Le modèle de lancement de mai 2024 a déjà dépassé l'extrémité basse de cette fenêtre.
Préparez activement la migration. Notez que « l'instantané répond encore » aujourd'hui ne garantit pas qu'il répondra demain. Programmez un rappel dans votre calendrier, réexécutez les évaluations face à gpt-4o-2024-11-20 ou à l'étiquette flottante gpt-4o pour mesurer l'écart comportemental, et préparez la migration pour qu'elle soit prête à être livrée avant l'annonce de la date de dépréciation plutôt qu'après.
Les équipes qui attendent l'e-mail de dépréciation ont tendance à découvrir que leur pipeline de production dépendait d'un comportement spécifique de l'instantané de lancement que les instantanés plus récents ont silencieusement modifié. Le travail de migration coûte plus cher lorsqu'on le réalise sous la pression du temps.
Ce qui a changé entre cet instantané et les suivants
Les écarts comportementaux qu'il vaut la peine de connaître si vous décidez de rester sur l'ancrage de lancement ou d'aller de l'avant.
Sorties structurées. L'instantané de mai prend en charge le mode JSON mais n'applique pas les schémas aussi strictement que la version d'août. Les analyseurs en aval qui s'appuient sur la validation de schéma peuvent échouer plus souvent face à cet instantané.
Calibrage des refus. Le modèle de lancement est plus agressif sur certains motifs de refus que les instantanés ultérieurs. Certains prompts légitimes sont refusés ici alors qu'ils passent sans encombre sur la version de novembre.
Raisonnement. L'instantané de novembre est visiblement plus fort sur les prompts multi-étapes. Pour les charges de travail qui évaluent la qualité du raisonnement, l'écart est significatif.
Latence. Les améliorations de la pile d'inférence au cours de 2024 font que l'étiquette flottante sert désormais la même classe de modèle avec une latence inférieure à celle de l'instantané de lancement. S'ancrer à cette date revient à renoncer à ces améliorations.
Schéma d'ancrage
Le schéma qui a bien vieilli :
- Ancrage dans les évaluations, l'intégration continue et tout chemin audité pour la conformité.
- Étiquette flottante en trafic de production.
- Diff hebdomadaire entre l'ancrage et l'étiquette flottante face à un ensemble fixe de prompts pour détecter tôt la dérive comportementale.
Pour l'instantané de lancement de mai 2024 en particulier, ajoutez : disposez d'un plan de migration documenté vers un instantané 4o plus récent ou vers la famille GPT-4.1 avant l'arrivée de la date de dépréciation.
Pour le contexte plus large de 4o, voir la page flottante GPT-4o. Pour la famille plus récente que la plupart des nouveaux développements devraient cibler, voir GPT-4.1.
Choisir ce modèle
Utilisez gpt-4o-2024-05-13 lorsque :
- Vous reproduisez un résultat spécifique lié au modèle de lancement.
- Un régime de conformité a approuvé cet identifiant exact et qu'une nouvelle approbation est en cours.
- Un workflow de recherche exige le comportement de référence de mai 2024.
Pour tout le reste, passez à un instantané plus récent ou à l'étiquette flottante. L'instantané de lancement a été un jalon ; ce n'est plus le bon palier de service.
Dernière revue technique : 2026-05-22 — Tokonomix.ai
