Aller au contenu
Tier C — Spécialiste
Fonctionne en :USCréé en :United States
OpenAI

gpt-4o-2024-05-13

Tier C — Spécialiste

Équipe éditoriale Tokonomix·Relu par Mes Kalkan··

GPT-4o-2024-05-13 est un grand modèle de langage multimodal développé par OpenAI, lancé en mai 2024. Ce modèle représente la première itération d'OpenAI de la série GPT-4o, où la désignation "o" indique une optimisation pour les entrées textuelles et multimodales. Il est conçu pour les tâches de génération de texte polyvalentes incluant la conversation, la création de contenu, l'analyse, l'assistance au codage et le raisonnement dans divers domaines. Le modèle traite les entrées textuelles et génère des sorties textuelles avec des capacités couvrant plusieurs langues et sujets techniques. Cette version constitue la version de production initiale de l'architecture GPT-4o, offrant des capacités de génération de texte standard qui équilibrent performance et accessibilité. Bien que les détails architecturaux spécifiques demeurent confidentiels, le modèle s'appuie sur les fondations établies par les variantes antérieures de GPT-4 tout en introduisant des améliorations architecturales visant une efficacité et une qualité de réponse supérieures. Le modèle prend en charge les conversations étendues et les instructions complexes, le rendant adapté aux applications allant du simple système de questions-réponses aux tâches analytiques sophistiquées. Au sein de la gamme de modèles d'OpenAI, GPT-4o-2024-05-13 occupe une position centrale en tant que modèle phare polyvalent. Il côtoie d'autres variantes GPT-4 dans l'offre d'OpenAI, offrant une alternative aux versions antérieures de GPT-4 et à la série plus compacte GPT-3.5. Le modèle est positionné pour les utilisateurs nécessitant des capacités avancées de compréhension et de génération du langage sans les fonctionnalités spécialisées des variantes spécifiques à un domaine ou expérimentales. Cet instantané représente l'état du modèle à sa date de lancement en mai 2024.

GPT-4o-2024-05-13 marque la première itération de la série GPT-4o, inaugurant l architecture omni d OpenAI.

Synthèse benchmark Tokonomix
Section 01

Scores de qualité

Résultats d'évaluation issus des notations du modèle juge sur diverses catégories de tâches. Les scores reflètent la cohérence, la précision et le suivi des instructions.

100
Génération de code
99
Multilingue
100
Raisonnement
Section 02

Historique des tarifs

Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.

💰
Tarifs API — gpt-4o-2024-05-13
$5.00 par 1M de tokens d'entrée
$15.00 par 1M de tokens de sortie
≈ $0.0060 par conversation typique (800 tokens)
Prix entrée vs sortie (par 1M de tokens)
par 1M de tokens d'entrée$5.00
par 1M de tokens de sortie$15.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$5.00

input / 1M

— stable

$15.00

output / 1M

— stable

2026-05-242026-06-142026-06-14
Input
Output
Price change
⟳ synced weekly
Section 03

Forces & faiblesses

Basé sur les résultats de benchmarks et les retours communautaires agrégés sur des cas d'usage réels.

Forces

Première version GPT-4oGénération textuelle robusteAssistance au développementCapacités multilinguesComportement figé et reproductibleRaisonnement général solide

Faiblesses

Versions plus récentes disponiblesFenêtre de contexte non spécifiée publiquementFonctionnalités inférieures aux versions suivantes
Section 04

Capacités

toolssource: litellmvisionpdf inputparallel toolsprompt cachingmax output tokens: 4096
Section 05

Questions fréquentes

Pour les applications de production nécessitant un comportement stable et reproductible, les versions datées garantissent l invariabilité du modèle.

La version fondatrice de GPT-4o qui a introduit les capacités omni dans la gamme OpenAI.

Synthèse benchmark Tokonomix
Section 06

Disponibilité

Disponibilité

Pas encore de données

Nous n'avons pas encore enregistré suffisamment d'appels API pour afficher les statistiques de disponibilité de ce modèle. Les données apparaîtront dès que le modèle reçoit du trafic en direct.

Section 07

Verdicts benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-596/100 · 75 runs
70 correct5 partial0 wrong93% accuracy
2026-06-14

Quality stable at 97.7 with new tools, vision, and caching capabilities

The gpt-4o-2024-05-13 model maintains its quality score at 97.7, demonstrating consistency across benchmark windows. This stability occurs alongside significant capability expansion, with the addition of tools, vision, PDF input, parallel tools, and prompt caching support. These enhancements position the model for more complex multimodal and workflow-oriented tasks without compromising its core performance metrics. The unchanged quality score suggests that OpenAI successfully integrated these new features while preserving the model's fundamental reasoning and generation capabilities. Users can now leverage vision-based tasks, process PDF documents directly, utilize function calling with parallel execution, and benefit from prompt caching for improved efficiency in repetitive operations. The model continues to deliver the same reliable performance baseline established in previous benchmarks while offering substantially broader functionality. Organizations already using this model can adopt these new capabilities with confidence that quality remains consistent. The combination of maintained performance and expanded feature set makes this a meaningful update for users requiring multimodal processing or advanced tool integration in their workflows.

Quality

Latency p50

Test runs

0

Quality maintained at 97.7 Vision and PDF support added Tool calling capabilities expanded Prompt caching now available
Section 08

Profil complet du modèle

gpt-4o-2024-05-13 — illustration 1
gpt-4o-2024-05-13 : l'instantané de lancement

gpt-4o-2024-05-13 est la version originale de GPT-4o, figée à la date de première disponibilité publique du modèle, le 13 mai 2024. C'est l'ancrage daté du premier modèle multimodal de génération chez OpenAI — celui qui a introduit le comportement unifié texte-vision-audio et redéfini les attentes de la discipline vis-à-vis d'une surface de modèle de frontière.

Pour la plupart des équipes, cet instantané est désormais trop ancien pour être recommandé. Pour le petit ensemble de cas où la reproductibilité face au modèle de lancement compte plus que toute amélioration ultérieure, il reste disponible.

Pourquoi cette date précise compte

Le lancement du 13 mai 2024 est le moment où le multimodal a cessé d'être une démonstration de recherche pour devenir une cible de déploiement. Les variantes antérieures de GPT-4 prenaient en charge la vision, mais la surface audio et la latence réduite sur le texte sont des contributions propres à 4o. Les équipes qui ont déposé des évaluations ou rédigé des contrats fournisseurs en référence au modèle de lancement veulent un point de référence stable ; cet instantané est ce point de référence.

Deux raisons précises de s'intéresser à cette date exacte.

Premièrement, les travaux comparatifs. Les équipes de recherche qui étudient les capacités des modèles d'une génération à l'autre ont besoin d'un modèle qui n'a pas changé silencieusement sous leurs expériences. L'instantané de lancement est le modèle qui a été évalué dans les notes de version originales d'OpenAI et dans la majeure partie des travaux d'évaluation tiers de mi-2024.

Deuxièmement, les déploiements réglementés approuvés sur la base du modèle de lancement. Certains régimes de conformité exigent que tout modèle traitant des données de production ait suivi un cycle d'évaluation spécifique. Si votre auditeur a approuvé la version de mai 2024 et que la migration vers un instantané plus récent n'est pas encore validée, c'est ce modèle que vous exécutez.

Ce que contient cet instantané

Tout ce qu'OpenAI a livré le jour du lancement. Entrée texte et image avec une fenêtre de contexte de 128k tokens. Surfaces audio via les points d'accès contemporains. Mode JSON, mais pas la fonctionnalité ultérieure de sorties structurées — celle-ci est arrivée avec la version du 6 août 2024. Appel de fonctions. Streaming. La surface Chat Completions ; la surface Responses a été ajoutée plus tard et ne fait pas partie du comportement de cet instantané.

Ce qui ne figure pas dans cet instantané, c'est tout ce qui a été introduit dans les versions ultérieures de 4o. La mise à jour du 6 août a ajouté des sorties structurées strictes et resserré le comportement du mode JSON. La mise à jour du 20 novembre a apporté des améliorations en matière de raisonnement et de qualité rédactionnelle. Aucune des deux n'est présente dans l'instantané de mai. Si votre pipeline en aval dépend d'un comportement particulier de sortie structurée, vérifiez sur quel instantané il a été construit avant de supposer que l'ancrage de mai est le bon choix.

Risque de fin de vie

Il s'agit du plus ancien instantané de 4o encore régulièrement disponible, ce qui signifie qu'il est le plus proche de sa date de fin de vie. L'horizon typique de dépréciation d'OpenAI pour les instantanés datés se situe entre douze et dix-huit mois après leur sortie. Le modèle de lancement de mai 2024 a déjà dépassé l'extrémité basse de cette fenêtre.

Préparez activement la migration. Notez que « l'instantané répond encore » aujourd'hui ne garantit pas qu'il répondra demain. Programmez un rappel dans votre calendrier, réexécutez les évaluations face à gpt-4o-2024-11-20 ou à l'étiquette flottante gpt-4o pour mesurer l'écart comportemental, et préparez la migration pour qu'elle soit prête à être livrée avant l'annonce de la date de dépréciation plutôt qu'après.

Les équipes qui attendent l'e-mail de dépréciation ont tendance à découvrir que leur pipeline de production dépendait d'un comportement spécifique de l'instantané de lancement que les instantanés plus récents ont silencieusement modifié. Le travail de migration coûte plus cher lorsqu'on le réalise sous la pression du temps.

Ce qui a changé entre cet instantané et les suivants

Les écarts comportementaux qu'il vaut la peine de connaître si vous décidez de rester sur l'ancrage de lancement ou d'aller de l'avant.

Sorties structurées. L'instantané de mai prend en charge le mode JSON mais n'applique pas les schémas aussi strictement que la version d'août. Les analyseurs en aval qui s'appuient sur la validation de schéma peuvent échouer plus souvent face à cet instantané.

Calibrage des refus. Le modèle de lancement est plus agressif sur certains motifs de refus que les instantanés ultérieurs. Certains prompts légitimes sont refusés ici alors qu'ils passent sans encombre sur la version de novembre.

Raisonnement. L'instantané de novembre est visiblement plus fort sur les prompts multi-étapes. Pour les charges de travail qui évaluent la qualité du raisonnement, l'écart est significatif.

Latence. Les améliorations de la pile d'inférence au cours de 2024 font que l'étiquette flottante sert désormais la même classe de modèle avec une latence inférieure à celle de l'instantané de lancement. S'ancrer à cette date revient à renoncer à ces améliorations.

Schéma d'ancrage

Le schéma qui a bien vieilli :

  • Ancrage dans les évaluations, l'intégration continue et tout chemin audité pour la conformité.
  • Étiquette flottante en trafic de production.
  • Diff hebdomadaire entre l'ancrage et l'étiquette flottante face à un ensemble fixe de prompts pour détecter tôt la dérive comportementale.

Pour l'instantané de lancement de mai 2024 en particulier, ajoutez : disposez d'un plan de migration documenté vers un instantané 4o plus récent ou vers la famille GPT-4.1 avant l'arrivée de la date de dépréciation.

Pour le contexte plus large de 4o, voir la page flottante GPT-4o. Pour la famille plus récente que la plupart des nouveaux développements devraient cibler, voir GPT-4.1.

Choisir ce modèle

Utilisez gpt-4o-2024-05-13 lorsque :

  • Vous reproduisez un résultat spécifique lié au modèle de lancement.
  • Un régime de conformité a approuvé cet identifiant exact et qu'une nouvelle approbation est en cours.
  • Un workflow de recherche exige le comportement de référence de mai 2024.

Pour tout le reste, passez à un instantané plus récent ou à l'étiquette flottante. L'instantané de lancement a été un jalon ; ce n'est plus le bon palier de service.

Dernière revue technique : 2026-05-22 — Tokonomix.ai

gpt-4o-2024-05-13 — illustration 2
Dernier test automatisé
14 juin 2026 · 05:02 UTC · Benchmark
Latence P50
1049 ms
Latence P95
Erreurs
0 / 6 exécutions
Dernière revue par Équipe Tokonomix·26 mai 2026