
gpt-3.5-turbo-0125 : la mise à jour de janvier 2024⚠️ Modèle obsolète. OpenAI a retiré ce modèle. Pour les nouveaux projets, consultez GPT-4o mini pour une utilisation générale économique ou GPT-4.1 pour un raisonnement plus robuste. Les intégrations existantes doivent planifier la migration avant la fermeture du point de terminaison API.
gpt-3.5-turbo-0125 est l'instantané daté de GPT-3.5 Turbo publié le 25 janvier 2024. Il s'agissait de la dernière mise à jour significative des capacités de la ligne 3.5 — suivi des instructions plus précis, correction des anomalies du mode JSON, et améliorations du tokeniseur qui ont rendu le modèle plus prévisible dans les cas limites.
Il est désormais retiré. L'identifiant épinglé se résout encore aujourd'hui mais l'horizon de dépréciation est fini, et les nouveaux projets ne devraient pas le cibler.
Ce qui a changé dans cette version
Le titre principal dans les notes d'OpenAI de janvier 2024 concernait le suivi des instructions. Les instantanés 3.5 antérieurs avaient l'habitude de paraphraser les instructions au lieu de les exécuter — le modèle reconnaissait une demande puis dérivait vers une réponse différente de celle réellement demandée par le prompt. La version 0125 a considérablement resserré ce comportement.
Pour les équipes utilisant la 3.5 en production, l'amélioration du suivi des instructions était le type de mise à niveau qui n'apparaît pas dans les scores de benchmark mais qui apparaît dans les scores d'évaluation par rapport à vos propres prompts. La même définition de tâche produisait une sortie plus propre, et les solutions de contournement au niveau des prompts écrites contre les instantanés antérieurs pouvaient souvent être abandonnées.
Le mode JSON était l'autre correction discrète. Les instantanés 3.5 antérieurs produisaient du JSON généralement valide mais occasionnellement mal formé dans des cas particuliers spécifiques — virgules traînantes dans les tableaux, accolades fermantes manquantes sous charge, échappement incohérent des chaînes imbriquées. La version 0125 en a corrigé suffisamment pour que les analyseurs en aval puissent abandonner une ou deux couches de traitement défensif.
Le profil de coût est resté au niveau où se situait le reste de la ligne 3.5, ce qui a rendu ces améliorations intéressantes à l'époque. Même prix, meilleur comportement.
Ce qui est resté défaillant
La profondeur de raisonnement. La 0125 restait un modèle de classe 3.5. Les prompts à plusieurs étapes nécessitant un véritable enchaînement d'inférences, la synthèse de code nouveau, les puzzles logiques denses — tous visiblement plus faibles que ce que GPT-4 fournissait déjà. La correction du suivi des instructions a rendu le modèle plus fiable ; elle n'a pas rendu le modèle plus intelligent dans un sens profond.
La factualité. Les hallucinations n'ont pas été traitées de manière structurelle. Le modèle inventait toujours des réponses confiantes lorsque le prompt ne contenait pas la réponse. La génération augmentée par récupération ou la révision humaine restait nécessaire sur tout parcours factuel.
Le calibrage des refus. Légèrement plus cohérent que les instantanés antérieurs, mais le schéma consistant à décliner des prompts inoffensifs et à se conformer à des cas limites auxquels les modèles de frontière résisteraient a persisté.
Pourquoi les équipes ont épinglé la 0125
Pendant la majeure partie de 2024, lorsque la 3.5 était l'option économique par défaut, c'était l'instantané sur lequel les équipes se fixaient. Trois raisons.
Premièrement, « la 3.5 stable la plus récente ». Les déploiements en production nécessitant la reproductibilité voulaient le modèle avec le moins d'anomalies connues ; la 0125 était l'option la plus récente et la moins défaillante.
Deuxièmement, les pipelines en aval réglés sur le comportement de la 0125. Une fois qu'un analyseur, une suite de tests CI ou un classificateur en aval affiné avait été construit contre cet instantané, le coût du réajustement contre un instantané plus récent était réel. L'épinglage protégeait cet investissement.
Troisièmement, les flux de travail réglementés approuvés pour cet identifiant. Certaines révisions de conformité ont été réalisées spécifiquement contre la 0125 et ne pouvaient pas passer à un instantané différent sans un nouveau cycle d'audit.
Ces trois raisons ont mal vieilli maintenant que la famille 3.5 est dépréciée. La cible de migration n'est plus un instantané 3.5 différent.
Migration aujourd'hui
L'instantané 0125 est plus récent que la version 3.5 originale et le calcul de migration est légèrement différent de la migration depuis le Turbo original.
Si vous avez épinglé la 0125 spécifiquement pour les améliorations du suivi des instructions, la migration comportementale la plus proche est GPT-4o mini. La latence est comparable, la surface API est identique, le suivi des instructions est nettement plus fort.
Si votre pipeline en aval dépend du comportement spécifique du mode JSON de la 0125, la fonctionnalité de sorties structurées dans les instantanés GPT-4o à partir d'août 2024 et dans toute la famille GPT-4.1 est un remplacement plus fiable. Vous devrez peut-être réajuster l'analyseur en aval ; l'essentiel est que l'application stricte du schéma élimine les modes de défaillance que les astuces d'ingénierie des prompts contournaient.
Si votre charge de travail orientée raisonnement poussait déjà la 0125 au-delà de son plafond, le passage à gpt-4.1-mini ou à la version complète GPT-4.1 représente le saut le plus important mais c'est celui qui correspond à la charge de travail.
Que faire aujourd'hui
Si la 0125 est encore dans votre stack :
Premièrement, auditez la charge de travail. La famille 3.5 était suffisamment performante pour une grande partie du trafic de production de l'ère 2024 ; la question est de savoir si votre charge de travail spécifique bénéficie toujours de cet épinglage ou si elle aurait dû être mise à niveau il y a un an.
Deuxièmement, effectuez une véritable évaluation par rapport à votre cible de migration candidate. Les modèles plus récents nécessitent souvent des prompts différents, et perpétuer l'ingénierie des prompts de l'ère 0125 peut faire paraître un successeur pire qu'il ne l'est.
Troisièmement, planifiez la transition avant que l'e-mail de dépréciation n'arrive. La famille 3.5 suit un calendrier fini. Le trafic de production sur un instantané 3.5 épinglé est un risque connu ; un risque connu est un risque que vous pouvez atténuer selon votre propre calendrier.
Pour la comparaison entre catégories, consultez /benchmarks/leaderboard.
Le choisir
Ne choisissez pas cet instantané pour de nouvelles constructions. La famille 3.5 est dépréciée et les identifiants épinglés finiront par être retirés.
Pour les intégrations existantes, planifiez la migration. Le successeur comportementalement le plus similaire pour les charges de travail de type 0125 est GPT-4o mini ; le mouvement tourné vers l'avenir est la famille GPT-4.1. Dans tous les cas, la transition devrait se produire selon votre calendrier de publication, pas selon le calendrier de dépréciation d'OpenAI.
Dernière révision technique : 2026-05-22 — Tokonomix.ai

