Tier B — Production

Fonctionne en :USCréé en :United States

$2.00

sortie · par 1M de tokens (coût de base)

Coût

2,427 ms

Vitesse de réponse

100 / 100

Intelligence

Verdict — résuméLIVE

● LIVE

maintenant · 2026-07-26

Quality drops 45 points with factual and reasoning scores falling to zero

✗ Quality dropped 45 points✗ Factual and reasoning scores zero✓ Multilingual performance remains excellent✗ Latency increased 3 percent

This benchmark window shows a significant degradation in gpt-5-mini-2025-08-07 performance, with the overall quality score plummeting from 81.3 to 36.3 out of 100. The most alarming change is the complete failure in factual and reasoning categories, both scoring zero compared to their absence from previous measurements where coding achieved perfect scores. This suggests either a regression in the model's core capabilities or fundamental issues with these newly-tested aspects. Multilingual performance remains the model's strongest area, maintaining near-perfect scores at 100 in the current window versus 99 previously. Creative tasks held steady at 45 across both windows, indicating some consistency in generation capabilities. Latency increased slightly from 6548ms to 6742ms at the median, representing a modest 3% slowdown that is unlikely to impact most use cases significantly. The previous window highlighted eight major capabilities including reasoning and vision support, but the current results suggest these additions may not be functioning as intended. Users should exercise caution when deploying this model for factual retrieval or logical reasoning tasks until these critical issues are addressed. The model appears most reliable for multilingual applications at present.

Quality

36.3

Latency p50

6,742 ms

Test runs

1 sur 11

Image et explicationLIVE

OpenAI

gpt-5-mini-2025-08-07

Tier B — Production

Équipe éditoriale Tokonomix·Relu par Mes Kalkan·Publié le 22 mai 2026·Dernière relecture 26 mai 2026

GPT-5-mini-2025-08-07 est un modèle de génération de texte développé par OpenAI, publié dans le cadre de la famille GPT-5 en 2025. Comme l'indique sa désignation "mini", ce modèle représente une variante plus petite et plus efficiente au sein de la gamme, conçue pour équilibrer capacité et efficacité computationnelle. Il traite et génère du texte similaire au langage humain à partir d'instructions en entrée, adapté aux applications incluant la génération de contenu, les agents conversationnels, l'analyse de texte et les tâches linguistiques polyvalentes. Le modèle présente des capacités standard de génération de texte sans fonctions multimodales spécialisées, se concentrant sur la compréhension et la production langagières fondamentales. La taille de sa fenêtre de contexte n'a pas été divulguée publiquement, bien qu'il conserve les caractéristiques architecturales essentielles de la série GPT-5, notamment des capacités de raisonnement améliorées et des réponses factuelles plus précises comparées aux générations précédentes. La date de publication en août 2025 suggère qu'il intègre des données d'entraînement et des raffinements architecturaux disponibles jusqu'à ce moment. Au sein de la gamme de modèles OpenAI, GPT-5-mini occupe une position d'option accessible pour les développeurs et organisations nécessitant un traitement du langage performant sans la surcharge computationnelle des modèles GPT-5 complets. Il sert les cas d'usage où la vitesse de réponse et l'efficience des ressources sont priorisées parallèlement à la qualité, le rendant approprié pour les applications à haut débit, les systèmes embarqués, ou les scénarios avec contraintes d'infrastructure. Le modèle maintient la compatibilité avec l'infrastructure API standard d'OpenAI et l'écosystème d'outils.

GPT-5-mini incarne la philosophie « mini » d'OpenAI portée à sa cinquième génération : des capacités de raisonnement améliorées dans un format optimisé pour la production à grande échelle.
— Analyse Tokonomix, série GPT-5

Capacités

toolssource: litellmvisionjson modepdf inputreasoningjson schemaparallel toolsprompt cachingmax output tokens: 128000

GPT-5 Mini (snapshot 2025-08-07) : le plus ancien pin daté de la gamme mini

Il s'agit du snapshot daté du GPT-5 Mini original, figé à la date de lancement du 7 août 2025. C'est le snapshot daté le plus ancien de la famille GPT-5 Mini — épinglé par les équipes qui ont adopté Mini dès le lancement de GPT-5 et qui n'ont pas migré depuis. La question opérationnelle qui définit ce pin n'est plus « faut-il l'épingler » mais « quand vais-je planifier la migration hors de ce pin, et vers quoi vais-je basculer ».

L'argument du délai de dépréciation

OpenAI publie des calendriers de dépréciation pour ses snapshots datés. Le schéma observé d'une génération de modèles à l'autre reste cohérent : les snapshots finissent par être retirés, avec au moins quelques mois de préavis. La date exacte est annoncée au moment où elle est annoncée, et n'est pas prévisible à l'avance.

Pour un snapshot présent depuis le lancement de GPT-5, la question n'est pas de savoir si la dépréciation arrive. Il s'agit de savoir si vous disposez d'un plan de migration prêt à exécuter le jour où OpenAI publie le calendrier. Les équipes qui opèrent sur ce pin depuis le plus longtemps sont aussi celles qui ont accumulé le plus d'investissement technique — des prompts calibrés sur le comportement spécifique du modèle, du parsing en aval qui dépend des particularités de ses sorties, des harnais d'évaluation qui prennent ce snapshot comme référence de base. Tout cela devra bouger lorsque le snapshot sera retiré.

La parade consiste à anticiper. Identifiez vers quel Mini plus récent vous comptez migrer. Lancez des évaluations périodiques contre cette cible. Construisez le travail d'ingénierie des prompts lié à la migration comme un projet identifié, et non comme une réponse en mode crise. Le coût est faible s'il est planifié. Il devient bien plus lourd s'il faut le réaliser sous la pression d'une échéance lorsque la date de dépréciation tombe.

Ce que ce snapshot capture

Le lancement d'août 2025 de GPT-5 Mini : poids de lancement, comportement de lancement sur la classification et l'extraction, profil de latence de lancement, configuration de l'encodeur visuel de lancement pour cette catégorie de taille. Le modèle n'a pas changé depuis.

Les améliorations que la ligne GPT-5 dans son ensemble a accumulées au fil des générations suivantes — meilleure précision en classification, sorties structurées plus rigoureuses, capacités visuelles améliorées, connaissance des évolutions postérieures à mi-2025 — aucune de ces avancées n'apparaît ici.

Sous le capot

Sur le plan architectural, il s'agit du décodeur transformer GPT-5 Mini à une échelle de paramètres inférieure à celle de la base 5.0. Le modèle accepte des entrées entrelacées de texte et d'images et produit une sortie uniquement textuelle. OpenAI n'a pas publié de nombre de paramètres.

La tokenisation utilise le vocabulaire BPE standard de GPT-5. Les entrées image sont encodées par tuiles, avec un coût en tokens fixe par tuile. La date de coupure d'entraînement se situe à mi-2025. Le modèle connaît les standards de langage et versions de frameworks courants jusqu'à cette période.

Les profils de coût par token et de latence par requête sont verrouillés sur les valeurs de lancement.

Où il se situe aujourd'hui

Comparé aux offres actuelles de la catégorie petite, le snapshot d'août 2025 de GPT-5 Mini se situe nettement en dessous des Mini GPT-5 plus récents sur la plupart des dimensions de benchmark. Le classement d'intelligence suit la position relative ; l'écart par rapport aux snapshots actuels s'est creusé à mesure que de nouvelles générations sont arrivées.

Pour les charges de travail courantes — classification basique, extraction simple, sorties structurées courtes, automatisation du service client sur des schémas bien rodés — le snapshot continue de produire un travail utile. Dès que l'on a besoin de connaissances postérieures à mi-2025, de capacités visuelles récentes ou des gains qualitatifs des Mini plus récents, ce modèle devient de plus en plus le mauvais choix.

Pour les workflows de contenu sur la partie très routinière du spectre et pour l'extraction de données sur des documents standards, le snapshot reste fonctionnel. Pour des charges de travail plus exigeantes, l'écart avec les pins plus récents devient visible.

Quand conserver ce pin en place

Les cas qui justifient de rester sur ce snapshot sont étroits et se réduisent :

Vous avez un outillage aval finement calibré sur les schémas de sortie spécifiques de ce modèle, et le coût de migration reste supérieur au coût cumulé de l'immobilisme.

Vous évoluez dans un contexte réglementé où ce pin précis fait partie d'un cycle d'audit actif, et changer de modèle exige une recertification qui n'a pas encore été déclenchée.

Votre charge de travail est réellement routinière et l'écart qualitatif avec les Mini plus récents n'affecte aucun résultat de façon mesurable.

Vous menez des expérimentations A/B au long cours où le bras de contrôle doit rester réellement figé pendant toute la durée du test, et le test n'est pas encore conclu.

Quand migrer maintenant

Les déclencheurs clairs :

OpenAI a publié le calendrier de dépréciation de ce snapshot, et la date est suffisamment proche pour exiger une planification active de la migration.

Votre charge de travail a évolué et nécessite désormais des capacités que cette génération ne possède pas — connaissances post-coupure, qualité visuelle, fiabilité des sorties structurées qu'offrent les Mini plus récents.

Votre harnais d'évaluation montre que l'écart qualitatif cumulé coûte cher en résultats concrets — plus de tickets de support, plus de travail de nettoyage, plus d'incidents visibles côté client.

Vous êtes à un point de refonte naturel de votre pipeline où le coût de migration est plus faible qu'à l'ordinaire.

Choisir la cible de migration

Les cibles naturelles sont les snapshots datés des générations Mini plus récentes : 5.2 Mini, 5.4 Mini, 5.5 Mini, ou la version courante au moment de votre migration. Le choix dépend des mêmes considérations que tout choix de Mini : besoins de capacité, sensibilité au coût, volonté de remigrer plus tard versus épingler la dernière version disponible.

La plupart des équipes qui quittent ce snapshot atterrissent sur le dernier Mini daté stable, présent depuis suffisamment longtemps pour que les correctifs de début de vie se soient stabilisés. Vous obtenez ainsi les gains qualitatifs de la nouvelle génération avec la stabilité opérationnelle d'un pin mature.

Le schéma de migration

Épinglez le snapshot cible en pré-production. Faites passer vos prompts existants à travers lui. Attendez-vous à devoir réaliser quelques ajustements, car les schémas de sortie diffèrent légèrement d'une génération à l'autre. Validez contre votre suite d'évaluation. Mettez à jour le parsing aval si des particularités de format ont changé. Basculez le trafic de production. Retirez l'ancien pin.

L'ensemble du projet prend généralement quelques semaines-ingénieur pour une charge de travail de complexité moyenne. Fait en amont de la dépréciation, c'est un projet planifié. Fait sous la pression d'une échéance, c'est un exercice d'urgence.

Alternatives

Pour les charges de travail nécessitant un comportement épinglé en catégorie mini chez un autre fournisseur, les snapshots datés comparables d'Anthropic et de Google offrent le même schéma d'épinglage avec des rapports coût/qualité potentiellement différents.

Pour les charges de travail optimisées en coût où l'écosystème OpenAI n'est pas structurant, de petits classificateurs open-weights tournant sur votre propre infrastructure offrent l'histoire de résidence des données et la prévisibilité opérationnelle que des slugs flottants ne peuvent pas garantir.

Dernière revue technique : 2026-05-22 — Tokonomix.ai

Comparaison des fournisseursLIVE

Comparaison des fournisseurs

Comparez chaque fournisseur de ce modèle — coût de base, qualité, latence et disponibilité.

Azure OpenAI (EU - Sweden)UE

Coût d’entrée✓ meilleur$0.2500

Coût de sortie$2.00

QualitéPas encore testé

Latence (p50)Pas encore testé

DisponibilitéPas encore testé

Coûts affichés par 1M de tokens (coût de base)

OpenAIUSCette offre

Coût d’entrée$0.2500

Coût de sortie$2.00

Qualité✓ meilleur100.0

Latence (p50)✓ meilleur2,427 ms

DisponibilitéPas encore testé

Coûts affichés par 1M de tokens (coût de base)

Intelligence de consensus

MODÈLE ENTIER

Les signaux de consensus sont à l’échelle du modèle — pas encore par fournisseur.

—

Utilité de l’agent (1–10)

—

Score de précision

Détections uniques

Requêtes validées

Votes de la communautéLIVE

Votes de la communauté

Ce que pensent les vrais visiteurs — par fournisseur.

Azure OpenAI (EU - Sweden)UE

Pas encore de votes de la communauté.

OpenAIUS

Pas encore de votes de la communauté.

Plus de résultats — par fournisseur

Qualité par catégorie

Grille de jeu

Pas encore de données.

Verdict du juge

■ OK 57%■ Partiel 0%■ Faux 43%

Jeux & arène

Pas encore de données.

Vitesse & santé

2,427 ms

Latence (p50)

—

Disponibilité

Qualité par catégorie

Grille de jeu

Pas encore de données.

Verdict du juge

■ OK 57%■ Partiel 0%■ Faux 43%

Jeux & arène

Pas encore de données.

Vitesse & santé

2,427 ms

Latence (p50)

—

Disponibilité

Question & réponse — parcourirLIVE

1 sur 80

🧠 intelligenceOpenAImultilingual · 2026-07-26score: 100

Bir mağazada %20 indirim uygulanıyor. 150 TL olan bir ürün indirimden sonra kaç TL olur?

%20 indirim demek fiyatın %80'ine düşmesi demektir. 150 × 0,80 = 120 Cevap: 120 TL.

Historique des tests — tous fournisseursLIVE

Score de qualité dans le tempsdernier 38

Vitesse — latence p50 dans le temps

Une tendance apparaît une fois ce modèle testé sur plusieurs jours.

📝Verdict — résuméLIVE

Quality drops 45 points with factual and reasoning scores falling to zero

🖼️Image et explicationLIVE

gpt-5-mini-2025-08-07

Capacités

L'argument du délai de dépréciation

Ce que ce snapshot capture

Sous le capot

Où il se situe aujourd'hui

Quand conserver ce pin en place

Quand migrer maintenant

Choisir la cible de migration

Le schéma de migration

Alternatives

📊Comparaison des fournisseursLIVE

🧠Intelligence de consensus

👥Votes de la communautéLIVE

🔬Plus de résultats — par fournisseur

💬Question & réponse — parcourirLIVE

🗂️Historique des tests — tous fournisseursLIVE

Verdict — résuméLIVE

Image et explicationLIVE

Comparaison des fournisseursLIVE

Intelligence de consensus

Votes de la communautéLIVE

Plus de résultats — par fournisseur

Question & réponse — parcourirLIVE

Historique des tests — tous fournisseursLIVE