Tier C — Spécialiste

Fonctionne en :USCréé en :United States

$15.00

sortie · par 1M de tokens (coût de base)

Coût

1,695 ms

Vitesse de réponse

100 / 100

Intelligence

Verdict — résuméLIVE

● LIVE

maintenant · 2026-07-26

Quality decline and latency increase observed across core performance metrics

✗ Quality score dropped 5 points✗ Latency increased 43%✓ Multilingual performance remains perfect✓ Strong reasoning score at 99

This benchmark window reveals notable performance degradation for gpt-4o-2024-05-13 compared to the previous evaluation period. The overall quality score dropped from 98.3 to 93.4, representing a 5-point decline that affects the model's competitive positioning. Latency deteriorated significantly, with the median response time increasing 43% from 1235ms to 1766ms, which may impact user experience in interactive applications. Category performance shows mixed results. Multilingual capabilities remained excellent at 100, maintaining parity with previous performance. Reasoning scored impressively at 99, demonstrating strong logical capabilities. However, factual accuracy scored only 83, suggesting potential reliability concerns for knowledge-intensive tasks. Creative performance at 92 shows a slight decline from the previous 95. The absence of coding scores in the current window prevents direct comparison in this critical category, though it previously achieved a perfect 100. Users should be aware of the latency increase when deploying this model in time-sensitive applications. The quality score reduction, while keeping the model in high-performance territory, indicates some regression that may warrant monitoring. Organizations relying on factual accuracy should conduct additional validation given the lower score in this category.

Quality

93.4

Latency p50

1,766 ms

Test runs

1 sur 14

Image et explicationLIVE

OpenAI

gpt-4o-2024-05-13

Tier C — Spécialiste

Équipe éditoriale Tokonomix·Relu par Mes Kalkan·Publié le 22 mai 2026·Dernière relecture 26 mai 2026

GPT-4o-2024-05-13 est un grand modèle de langage multimodal développé par OpenAI, lancé en mai 2024. Ce modèle représente la première itération d'OpenAI de la série GPT-4o, où la désignation "o" indique une optimisation pour les entrées textuelles et multimodales. Il est conçu pour les tâches de génération de texte polyvalentes incluant la conversation, la création de contenu, l'analyse, l'assistance au codage et le raisonnement dans divers domaines. Le modèle traite les entrées textuelles et génère des sorties textuelles avec des capacités couvrant plusieurs langues et sujets techniques. Cette version constitue la version de production initiale de l'architecture GPT-4o, offrant des capacités de génération de texte standard qui équilibrent performance et accessibilité. Bien que les détails architecturaux spécifiques demeurent confidentiels, le modèle s'appuie sur les fondations établies par les variantes antérieures de GPT-4 tout en introduisant des améliorations architecturales visant une efficacité et une qualité de réponse supérieures. Le modèle prend en charge les conversations étendues et les instructions complexes, le rendant adapté aux applications allant du simple système de questions-réponses aux tâches analytiques sophistiquées. Au sein de la gamme de modèles d'OpenAI, GPT-4o-2024-05-13 occupe une position centrale en tant que modèle phare polyvalent. Il côtoie d'autres variantes GPT-4 dans l'offre d'OpenAI, offrant une alternative aux versions antérieures de GPT-4 et à la série plus compacte GPT-3.5. Le modèle est positionné pour les utilisateurs nécessitant des capacités avancées de compréhension et de génération du langage sans les fonctionnalités spécialisées des variantes spécifiques à un domaine ou expérimentales. Cet instantané représente l'état du modèle à sa date de lancement en mai 2024.

GPT-4o-2024-05-13 marque la première itération de la série GPT-4o, inaugurant l architecture omni d OpenAI.
— Synthèse benchmark Tokonomix

Capacités

toolssource: litellmvisionpdf inputparallel toolsprompt cachingmax output tokens: 4096

gpt-4o-2024-05-13 : l'instantané de lancement

gpt-4o-2024-05-13 est la version originale de GPT-4o, figée à la date de première disponibilité publique du modèle, le 13 mai 2024. C'est l'ancrage daté du premier modèle multimodal de génération chez OpenAI — celui qui a introduit le comportement unifié texte-vision-audio et redéfini les attentes de la discipline vis-à-vis d'une surface de modèle de frontière.

Pour la plupart des équipes, cet instantané est désormais trop ancien pour être recommandé. Pour le petit ensemble de cas où la reproductibilité face au modèle de lancement compte plus que toute amélioration ultérieure, il reste disponible.

Pourquoi cette date précise compte

Le lancement du 13 mai 2024 est le moment où le multimodal a cessé d'être une démonstration de recherche pour devenir une cible de déploiement. Les variantes antérieures de GPT-4 prenaient en charge la vision, mais la surface audio et la latence réduite sur le texte sont des contributions propres à 4o. Les équipes qui ont déposé des évaluations ou rédigé des contrats fournisseurs en référence au modèle de lancement veulent un point de référence stable ; cet instantané est ce point de référence.

Deux raisons précises de s'intéresser à cette date exacte.

Premièrement, les travaux comparatifs. Les équipes de recherche qui étudient les capacités des modèles d'une génération à l'autre ont besoin d'un modèle qui n'a pas changé silencieusement sous leurs expériences. L'instantané de lancement est le modèle qui a été évalué dans les notes de version originales d'OpenAI et dans la majeure partie des travaux d'évaluation tiers de mi-2024.

Deuxièmement, les déploiements réglementés approuvés sur la base du modèle de lancement. Certains régimes de conformité exigent que tout modèle traitant des données de production ait suivi un cycle d'évaluation spécifique. Si votre auditeur a approuvé la version de mai 2024 et que la migration vers un instantané plus récent n'est pas encore validée, c'est ce modèle que vous exécutez.

Ce que contient cet instantané

Tout ce qu'OpenAI a livré le jour du lancement. Entrée texte et image avec une fenêtre de contexte de 128k tokens. Surfaces audio via les points d'accès contemporains. Mode JSON, mais pas la fonctionnalité ultérieure de sorties structurées — celle-ci est arrivée avec la version du 6 août 2024. Appel de fonctions. Streaming. La surface Chat Completions ; la surface Responses a été ajoutée plus tard et ne fait pas partie du comportement de cet instantané.

Ce qui ne figure pas dans cet instantané, c'est tout ce qui a été introduit dans les versions ultérieures de 4o. La mise à jour du 6 août a ajouté des sorties structurées strictes et resserré le comportement du mode JSON. La mise à jour du 20 novembre a apporté des améliorations en matière de raisonnement et de qualité rédactionnelle. Aucune des deux n'est présente dans l'instantané de mai. Si votre pipeline en aval dépend d'un comportement particulier de sortie structurée, vérifiez sur quel instantané il a été construit avant de supposer que l'ancrage de mai est le bon choix.

Risque de fin de vie

Il s'agit du plus ancien instantané de 4o encore régulièrement disponible, ce qui signifie qu'il est le plus proche de sa date de fin de vie. L'horizon typique de dépréciation d'OpenAI pour les instantanés datés se situe entre douze et dix-huit mois après leur sortie. Le modèle de lancement de mai 2024 a déjà dépassé l'extrémité basse de cette fenêtre.

Préparez activement la migration. Notez que « l'instantané répond encore » aujourd'hui ne garantit pas qu'il répondra demain. Programmez un rappel dans votre calendrier, réexécutez les évaluations face à gpt-4o-2024-11-20 ou à l'étiquette flottante gpt-4o pour mesurer l'écart comportemental, et préparez la migration pour qu'elle soit prête à être livrée avant l'annonce de la date de dépréciation plutôt qu'après.

Les équipes qui attendent l'e-mail de dépréciation ont tendance à découvrir que leur pipeline de production dépendait d'un comportement spécifique de l'instantané de lancement que les instantanés plus récents ont silencieusement modifié. Le travail de migration coûte plus cher lorsqu'on le réalise sous la pression du temps.

Ce qui a changé entre cet instantané et les suivants

Les écarts comportementaux qu'il vaut la peine de connaître si vous décidez de rester sur l'ancrage de lancement ou d'aller de l'avant.

Sorties structurées. L'instantané de mai prend en charge le mode JSON mais n'applique pas les schémas aussi strictement que la version d'août. Les analyseurs en aval qui s'appuient sur la validation de schéma peuvent échouer plus souvent face à cet instantané.

Calibrage des refus. Le modèle de lancement est plus agressif sur certains motifs de refus que les instantanés ultérieurs. Certains prompts légitimes sont refusés ici alors qu'ils passent sans encombre sur la version de novembre.

Raisonnement. L'instantané de novembre est visiblement plus fort sur les prompts multi-étapes. Pour les charges de travail qui évaluent la qualité du raisonnement, l'écart est significatif.

Latence. Les améliorations de la pile d'inférence au cours de 2024 font que l'étiquette flottante sert désormais la même classe de modèle avec une latence inférieure à celle de l'instantané de lancement. S'ancrer à cette date revient à renoncer à ces améliorations.

Schéma d'ancrage

Le schéma qui a bien vieilli :

Ancrage dans les évaluations, l'intégration continue et tout chemin audité pour la conformité.
Étiquette flottante en trafic de production.
Diff hebdomadaire entre l'ancrage et l'étiquette flottante face à un ensemble fixe de prompts pour détecter tôt la dérive comportementale.

Pour l'instantané de lancement de mai 2024 en particulier, ajoutez : disposez d'un plan de migration documenté vers un instantané 4o plus récent ou vers la famille GPT-4.1 avant l'arrivée de la date de dépréciation.

Pour le contexte plus large de 4o, voir la page flottante GPT-4o. Pour la famille plus récente que la plupart des nouveaux développements devraient cibler, voir GPT-4.1.

Choisir ce modèle

Utilisez gpt-4o-2024-05-13 lorsque :

Vous reproduisez un résultat spécifique lié au modèle de lancement.
Un régime de conformité a approuvé cet identifiant exact et qu'une nouvelle approbation est en cours.
Un workflow de recherche exige le comportement de référence de mai 2024.

Pour tout le reste, passez à un instantané plus récent ou à l'étiquette flottante. L'instantané de lancement a été un jalon ; ce n'est plus le bon palier de service.

Dernière revue technique : 2026-05-22 — Tokonomix.ai

Comparaison des fournisseursLIVE

Comparaison des fournisseurs

Comparez chaque fournisseur de ce modèle — coût de base, qualité, latence et disponibilité.

Azure OpenAI (EU - Sweden)UE

Coût d’entrée✓ meilleur$2.75

Coût de sortie$11.00

QualitéPas encore testé

Latence (p50)Pas encore testé

DisponibilitéPas encore testé

Coûts affichés par 1M de tokens (coût de base)

OpenAIUSCette offre

Coût d’entrée$5.00

Coût de sortie$15.00

Qualité✓ meilleur100.0

Latence (p50)✓ meilleur1,695 ms

DisponibilitéPas encore testé

Coûts affichés par 1M de tokens (coût de base)

Intelligence de consensus

MODÈLE ENTIER

Les signaux de consensus sont à l’échelle du modèle — pas encore par fournisseur.

8.0

Utilité de l’agent (1–10)

—

Score de précision

Détections uniques

Requêtes validées

Gravité des constats

■ Élevée 100%■ Moyenne 0%■ Faible 0%

Votes de la communautéLIVE

Votes de la communauté

Ce que pensent les vrais visiteurs — par fournisseur.

Azure OpenAI (EU - Sweden)UE

Pas encore de votes de la communauté.

OpenAIUS

Pas encore de votes de la communauté.

Plus de résultats — par fournisseur

Qualité par catégorie

Grille de jeu

Pas encore de données.

Verdict du juge

■ OK 94%■ Partiel 6%■ Faux 0%

Jeux & arène

joués

victoires

défaites

20.8 ± 7.2

TrueSkill (μ±σ)

Vitesse & santé

1,695 ms

Latence (p50)

—

Disponibilité

Qualité par catégorie

Grille de jeu

Pas encore de données.

Verdict du juge

■ OK 94%■ Partiel 6%■ Faux 0%

Jeux & arène

joués

victoires

défaites

20.8 ± 7.2

TrueSkill (μ±σ)

Vitesse & santé

1,695 ms

Latence (p50)

—

Disponibilité

Question & réponse — parcourirLIVE

1 sur 81

🧠 intelligenceOpenAImultilingual · 2026-07-26score: 100

Bir mağazada %20 indirim uygulanıyor. 150 TL olan bir ürün indirimden sonra kaç TL olur?

150 TL olan bir ürüne %20 indirim uygulandığında, önce indirimin ne kadar olduğunu hesaplamamız gerekiyor. %20 indirim, ürünün fiyatının %20'si kadardır. 150 TL'nin %20'si şu şekilde hesaplanır: \[ 150 \, \text{TL} \times \frac{20}{100} = 150 \, \text{TL} \times 0.20 = 30 \, \text{TL} \] İndirim tutarı 30 TL'dir. Bu tutarı 150 TL'den çıkardığımızda indirimli fiyatı buluruz: \[ 150 \, \text{TL} - 30 \, \text{TL} = 120 \, \text{TL} \] Dolayısıyla, 150 TL olan bir ürün indirimden sonra 120 TL olur.

Historique des tests — tous fournisseursLIVE

Score de qualité dans le tempsdernier 93

Vitesse — latence p50 dans le temps

Une tendance apparaît une fois ce modèle testé sur plusieurs jours.

📝Verdict — résuméLIVE

Quality decline and latency increase observed across core performance metrics

🖼️Image et explicationLIVE

gpt-4o-2024-05-13

Capacités

Pourquoi cette date précise compte

Ce que contient cet instantané

Risque de fin de vie

Ce qui a changé entre cet instantané et les suivants

Schéma d'ancrage

Choisir ce modèle

📊Comparaison des fournisseursLIVE

🧠Intelligence de consensus

👥Votes de la communautéLIVE

🔬Plus de résultats — par fournisseur

💬Question & réponse — parcourirLIVE

🗂️Historique des tests — tous fournisseursLIVE

Verdict — résuméLIVE

Image et explicationLIVE

Comparaison des fournisseursLIVE

Intelligence de consensus

Votes de la communautéLIVE

Plus de résultats — par fournisseur

Question & réponse — parcourirLIVE

Historique des tests — tous fournisseursLIVE