
gpt-3.5-turbo-instruct-0914 : l'instantané d'instruction figé⚠️ Modèle obsolète. OpenAI a retiré ce modèle. Pour les nouveaux projets, consultez GPT-4o mini pour une utilisation générale économique ou GPT-4.1 pour un raisonnement plus robuste. Les intégrations existantes doivent planifier la migration avant la fermeture du point de terminaison API.
gpt-3.5-turbo-instruct-0914 est l'instantané daté de la variante d'instruction GPT-3.5 Turbo d'OpenAI, figé à la version du 14 septembre 2023. Il s'agit de l'identifiant fixe pour la variante qui exposait la version 3.5 via l'API Completions héritée plutôt que par l'interface de dialogue.
Le modèle est obsolète. La surface de l'API Completions elle-même est en voie d'abandon dans toute la gamme OpenAI. Les nouveaux projets ne doivent pas cibler cet identifiant.
Pourquoi cette date spécifique est importante
La version de septembre 2023 était l'instantané que la plupart des équipes de production ont fini par figer lorsqu'elles avaient besoin de reproductibilité avec la variante d'instruction. Cette version précédait les changements majeurs de la famille 3.5 qui sont arrivés avec la mise à jour DevDay de novembre 2023 — pas de mode JSON, pas d'appels de fonctions parallèles, rien de tout cela. Ce qu'elle offrait était un modèle stable et bien compris sur lequel la première génération de produits adossés aux LLM avait été construite.
Pour les équipes qui ont archivé des évaluations ou rédigé des contrats fournisseurs faisant référence à la variante d'instruction, cet instantané est souvent celui qui est nommé. Pour les flux de travail de recherche nécessitant une reproductibilité par rapport au modèle utilisé dans un article ou un benchmark spécifique de fin 2023, c'est fréquemment l'identifiant concerné.
Le contexte plus large est que la variante d'instruction existait précisément pour donner au code écrit contre l'ancienne API Completions une voie d'évolution sans imposer une réarchitecture de l'interface de dialogue. Figer un instantané spécifique de cette variante est doublement conservateur — à la fois la surface de l'API et le comportement du modèle sont figés dans le temps.
Ce qui est livré dans cet instantané
La variante d'instruction de GPT-3.5 Turbo telle qu'elle existait en septembre 2023. Fenêtre de contexte de 16 385 tokens. Entrée de prompt sous forme de chaîne unique via l'API Completions héritée, sortie de complétion sous forme de chaîne unique. Logprobs disponibles directement via l'API. Pas de formatage de dialogue, pas de prompting basé sur les rôles, aucun des schémas de réponse entraînés pour le dialogue.
Ce qui n'est pas dans cet instantané, c'est tout ce qui est arrivé dans les versions 3.5 ultérieures. Pas de mode JSON. Pas d'appels de fonctions parallèles. Pas de paramètre seed pour la reproductibilité — ce qui est légèrement ironique étant donné que c'est l'instantané figé à des fins de reproductibilité ; vous obtenez une stabilité des poids du modèle sans les outils de reproductibilité au niveau de l'API.
Le comportement du modèle est de génération 3.5. Profondeur de raisonnement à ce niveau. Factualité qui nécessitait une recherche ou une vérification sur les chemins factuels. Calibrage du refus qui était moins cohérent que ce qui est arrivé plus tard.
Pourquoi les équipes continuent de le figer
Trois raisons apparaissent dans les audits.
Premièrement, les dépendances du code en aval sur les logprobs de cet instantané. Les pipelines de classification, les systèmes de décodage contraint et les travaux d'échantillonnage structuré construits autour des distributions logprob spécifiques de l'instantané de septembre peuvent régresser lorsqu'ils sont mis à jour. Le comportement du modèle des instantanés ultérieurs est similaire mais les distributions de probabilité ne sont pas identiques, et les pipelines en aval calibrés suffisamment finement pour ressentir la différence sont difficiles à modifier.
Deuxièmement, les flux de travail réglementés qui ont approuvé exactement cet identifiant. Certaines revues de conformité de fin 2023 ont nommé spécifiquement l'instantané de septembre et le cycle de réapprobation est suffisamment lent pour que le figement n'ait pas bougé.
Troisièmement, la reproductibilité de la recherche. Les articles et évaluations internes de fin 2023 qui ont utilisé la variante d'instruction font souvent référence à cet instantané, qu'ils le disent explicitement ou non. Le figement permet à ces résultats de rester reproductibles.
Ce que signifie le calendrier d'obsolescence
C'est l'un des instantanés datés encore résolvables les plus anciens de la gamme OpenAI. Les horizons d'obsolescence pour les instantanés datés s'étendent de douze à dix-huit mois selon le calendrier typique d'OpenAI. Septembre 2023 est bien au-delà de l'extrémité précoce de cette fenêtre. Le fait que le point de terminaison réponde encore aujourd'hui n'est pas une garantie qu'il répondra demain.
L'urgence de la migration est réelle. Planifiez-la activement. Définissez un rappel de calendrier. Notez que la cible de migration n'est pas un autre instantané d'instruction — la surface de l'API Completions est en voie d'abandon, donc la migration se fait vers l'interface de dialogue sur un modèle actuel, avec le travail architectural que cela implique.
Migration
Le même schéma qui s'applique à la variante d'instruction plus large s'applique ici, avec la contrainte supplémentaire que vous migrez depuis un instantané figé plutôt que depuis l'étiquette flottante.
Pour les charges de travail figées sur les distributions logprob, évaluez si le travail en aval peut passer à la fonctionnalité de sorties structurées strictes sur les modèles OpenAI actuels. L'application du schéma au niveau de l'inférence est souvent un remplacement plus propre pour l'échantillonnage conscient des logprob que de chercher un modèle d'instruction successeur qui n'existe pas.
Pour les charges de travail figées par conformité, le cycle de réapprobation fait partie du coût de migration. Commencez la conversation avec les auditeurs avant que la date d'obsolescence soit annoncée ; le faire sous pression temporelle est plus coûteux.
Pour les charges de travail figées pour la reproductibilité de la recherche, la réponse pratique est de publier des chiffres de base par rapport à un modèle actuel aux côtés des chiffres historiques, puis de faire la transition du pipeline de production. Les résultats historiques restent reproductibles par rapport aux instantanés archivés et aux sorties enregistrées ; le système en direct s'exécute sur les poids actuels.
Pour le contexte d'instruction flottant, consultez gpt-3.5-turbo-instruct. Pour la gamme OpenAI actuelle, consultez GPT-4.1 et GPT-4o mini.
Que faire aujourd'hui
Si cet identifiant est encore dans votre code, les étapes sont concrètes.
Premièrement, trouvez le site d'appel et documentez pourquoi le figement existe. Les raisons ci-dessus sont les plus courantes ; la raison de votre équipe peut être plus spécifique.
Deuxièmement, effectuez une évaluation réelle par rapport à votre cible de migration candidate. Les modèles plus récents et l'interface de dialogue nécessitent un prompting différent ; transposer les schémas de l'ère d'instruction peut faire paraître un successeur pire qu'il ne l'est.
Troisièmement, planifiez le basculement pour une fenêtre de version de votre choix, pas sous la pression de l'obsolescence. L'instantané de septembre 2023 se situe à l'extrémité la plus ancienne de la gamme OpenAI. La date d'obsolescence est plus proche que la date de version.
Le choisir
Ne choisissez pas cet instantané pour de nouvelles constructions. Il est obsolète et la surface de l'API elle-même est en voie d'abandon.
Pour les intégrations existantes, la cible de migration est un modèle d'interface de dialogue actuel — GPT-4o mini pour le trafic de type dialogue, GPT-4.1 ou GPT-4.1 mini pour les charges de travail où le plafond de raisonnement 3.5 était déjà une contrainte. Planifiez délibérément.
Dernière révision technique : 2026-05-22 — Tokonomix.ai
