Pour quels usages legacy est-il encore pertinent ?

Les intégrations utilisant l endpoint completions d OpenAI, certains outils de templating et les pipelines construits avant le passage au chat.

Le snapshot 0914 est-il maintenu ?

Les snapshots datés d OpenAI sont maintenus pour une période définie avant dépréciation progressive.

Peut-on migrer facilement vers un modèle chat ?

Avec une adaptation du format des prompts, la migration vers GPT-3.5-turbo ou GPT-4 en mode chat est généralement faisable.

GPT-3.5-turbo-instruct est-il moins coûteux que les variantes chat ?

En général oui, les modèles de complétion instruct ont une tarification différente des modèles chat dans la gamme OpenAI.

Fonctionne en :USCréé en :United States

Archivé

Ce modèle a été retiré par le fournisseur. Les données historiques sont conservées.

Plus disponible depuis le 27 mai 2026.

OpenAI

gpt-3.5-turbo-instruct-0914

Équipe éditoriale Tokonomix·Relu par Mes Kalkan·Publié le 22 mai 2026·Dernière relecture 26 mai 2026

GPT-3.5-turbo-instruct-0914 est un modèle de complétion de texte développé par OpenAI, lancé en septembre 2023. Contrairement aux variantes GPT-3.5-turbo orientées conversation, ce modèle utilise l'architecture instruct plus ancienne introduite initialement avec GPT-3, le rendant plus adapté aux tâches de complétion en un seul tour plutôt qu'aux conversations multi-tours. Il est conçu pour les applications nécessitant une continuation directe de texte, de la classification, de la transformation et d'autres opérations traditionnelles de modèle de langage sans la surcharge de formatage conversationnel. Le modèle traite les requêtes standard de génération de texte et suit les instructions intégrées dans les prompts. Il représente une continuation de la lignée InstructGPT d'OpenAI, qui applique l'apprentissage par renforcement à partir de retours humains (RLHF) pour améliorer les capacités de suivi d'instructions. La désignation « 0914 » indique la date spécifique de l'instantané du 14 septembre 2023. Bien que la taille de sa fenêtre de contexte n'ait pas été divulguée publiquement par OpenAI, il devrait gérer les tâches de complétion typiques dans des contraintes de longueur standard. Au sein de la gamme de modèles d'OpenAI, gpt-3.5-turbo-instruct-0914 occupe une position spécialisée aux côtés des variantes GPT-3.5 et GPT-4 optimisées pour le chat plus couramment utilisées. Il sert les utilisateurs qui ont spécifiquement besoin de sorties de type complétion plutôt que de réponses conversationnelles, le rendant particulièrement pertinent pour les applications héritées, certaines intégrations API et les cas d'usage où le paradigme de complétion offre un contrôle plus direct sur le formatage des sorties. Le modèle fournit un schéma d'interface alternatif pour les développeurs qui préfèrent ou nécessitent l'approche de complétion traditionnelle plutôt que les interactions basées sur le chat.

GPT-3.5-turbo-instruct est une variante de complétion classique, adaptée aux pipelines textuels sans format conversationnel.
— Synthèse benchmark Tokonomix

Section 01

Historique des tarifs

Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.

💰

Tarifs API — gpt-3.5-turbo-instruct-0914

$1.50 par 1M de tokens d'entrée

$2.00 par 1M de tokens de sortie

≈ $0.0013 par conversation typique (800 tokens)

Prix entrée vs sortie (par 1M de tokens)

par 1M de tokens d'entrée$1.50

par 1M de tokens de sortie$2.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.50

input / 1M

— no change

$2.00

output / 1M

— no change

2026-05-242026-05-242026-05-24

Input

Output

Price change

⟳ synced weekly

Section 02

Forces & faiblesses

Basé sur les résultats de benchmarks et les retours communautaires agrégés sur des cas d'usage réels.

Forces

Mode complétion de texte classiqueRéponses directes sans overheadContrôle fin de la générationCompatible avec pipelines textuels existantsBon pour tâches de transformation

Faiblesses

Non optimisé pour dialogues multi-toursArchitecture précédente à GPT-4Raisonnement limité vs modèles récentsFenêtre de contexte non spécifiée publiquement

Section 03

Questions fréquentes

Le mode instruct utilise l architecture de complétion classique pour suivre des instructions directes, tandis que le mode chat est optimisé pour les conversations multi-tours.

Pour les intégrations legacy nécessitant le mode completion plutôt que chat, ce modèle reste une référence solide.
— Synthèse benchmark Tokonomix

Section 04

Disponibilité

Pas encore de données

Nous n'avons pas encore enregistré suffisamment d'appels API pour afficher les statistiques de disponibilité de ce modèle. Les données apparaîtront dès que le modèle reçoit du trafic en direct.

Section 05

Verdicts benchmark Tokonomix

● 2026-05-24

Référence établie pour le modèle de suivi d'instructions GPT-3.5 Turbo Instruct

Cette évaluation constitue le premier benchmark pour gpt-3.5-turbo-instruct-0914, établissant des métriques de performance de référence pour les comparaisons futures. En tant que variante de GPT-3.5 Turbo axée sur le suivi d'instructions et optimisée pour des tâches de complétion en un seul tour plutôt que pour le dialogue, ce modèle répond à un cas d'usage distinct dans la gamme d'OpenAI. Sans données antérieures pour effectuer une comparaison, ce verdict se concentre sur l'établissement de l'empreinte de performance initiale. Les utilisateurs doivent noter que ce modèle diffère du GPT-3.5 Turbo standard par sa philosophie de conception, privilégiant l'exécution directe d'instructions plutôt que les interactions conversationnelles. La variante instruct excelle généralement dans l'exécution de tâches simples, la classification et la génération de sorties structurées, où un prompt explicite produit des résultats prévisibles. S'agissant d'un instantané de septembre 2014, les utilisateurs peuvent s'attendre à un comportement stable pour les applications nécessitant des capacités cohérentes de suivi d'instructions. Les verdicts futurs suivront toute variation de performance, amélioration des capacités ou changement comportemental par rapport à cette référence établie. Les organisations qui déploient des applications en production devraient surveiller les benchmarks ultérieurs afin de comprendre comment ce modèle évolue par rapport à ces mesures initiales.

Quality

—

Latency p50

—

Test runs

✓ Mesures de référence établies✓ Optimisation du suivi des instructions confirmée

Section 06

Profil complet du modèle

⚠️ Modèle obsolète. OpenAI a retiré ce modèle. Pour les nouveaux projets, consultez GPT-4o mini pour une utilisation générale économique ou GPT-4.1 pour un raisonnement plus robuste. Les intégrations existantes doivent planifier la migration avant la fermeture du point de terminaison API.

gpt-3.5-turbo-instruct-0914 : l'instantané d'instruction figé

gpt-3.5-turbo-instruct-0914 est l'instantané daté de la variante d'instruction GPT-3.5 Turbo d'OpenAI, figé à la version du 14 septembre 2023. Il s'agit de l'identifiant fixe pour la variante qui exposait la version 3.5 via l'API Completions héritée plutôt que par l'interface de dialogue.

Le modèle est obsolète. La surface de l'API Completions elle-même est en voie d'abandon dans toute la gamme OpenAI. Les nouveaux projets ne doivent pas cibler cet identifiant.

Pourquoi cette date spécifique est importante

La version de septembre 2023 était l'instantané que la plupart des équipes de production ont fini par figer lorsqu'elles avaient besoin de reproductibilité avec la variante d'instruction. Cette version précédait les changements majeurs de la famille 3.5 qui sont arrivés avec la mise à jour DevDay de novembre 2023 — pas de mode JSON, pas d'appels de fonctions parallèles, rien de tout cela. Ce qu'elle offrait était un modèle stable et bien compris sur lequel la première génération de produits adossés aux LLM avait été construite.

Pour les équipes qui ont archivé des évaluations ou rédigé des contrats fournisseurs faisant référence à la variante d'instruction, cet instantané est souvent celui qui est nommé. Pour les flux de travail de recherche nécessitant une reproductibilité par rapport au modèle utilisé dans un article ou un benchmark spécifique de fin 2023, c'est fréquemment l'identifiant concerné.

Le contexte plus large est que la variante d'instruction existait précisément pour donner au code écrit contre l'ancienne API Completions une voie d'évolution sans imposer une réarchitecture de l'interface de dialogue. Figer un instantané spécifique de cette variante est doublement conservateur — à la fois la surface de l'API et le comportement du modèle sont figés dans le temps.

Ce qui est livré dans cet instantané

La variante d'instruction de GPT-3.5 Turbo telle qu'elle existait en septembre 2023. Fenêtre de contexte de 16 385 tokens. Entrée de prompt sous forme de chaîne unique via l'API Completions héritée, sortie de complétion sous forme de chaîne unique. Logprobs disponibles directement via l'API. Pas de formatage de dialogue, pas de prompting basé sur les rôles, aucun des schémas de réponse entraînés pour le dialogue.

Ce qui n'est pas dans cet instantané, c'est tout ce qui est arrivé dans les versions 3.5 ultérieures. Pas de mode JSON. Pas d'appels de fonctions parallèles. Pas de paramètre seed pour la reproductibilité — ce qui est légèrement ironique étant donné que c'est l'instantané figé à des fins de reproductibilité ; vous obtenez une stabilité des poids du modèle sans les outils de reproductibilité au niveau de l'API.

Le comportement du modèle est de génération 3.5. Profondeur de raisonnement à ce niveau. Factualité qui nécessitait une recherche ou une vérification sur les chemins factuels. Calibrage du refus qui était moins cohérent que ce qui est arrivé plus tard.

Pourquoi les équipes continuent de le figer

Trois raisons apparaissent dans les audits.

Premièrement, les dépendances du code en aval sur les logprobs de cet instantané. Les pipelines de classification, les systèmes de décodage contraint et les travaux d'échantillonnage structuré construits autour des distributions logprob spécifiques de l'instantané de septembre peuvent régresser lorsqu'ils sont mis à jour. Le comportement du modèle des instantanés ultérieurs est similaire mais les distributions de probabilité ne sont pas identiques, et les pipelines en aval calibrés suffisamment finement pour ressentir la différence sont difficiles à modifier.

Deuxièmement, les flux de travail réglementés qui ont approuvé exactement cet identifiant. Certaines revues de conformité de fin 2023 ont nommé spécifiquement l'instantané de septembre et le cycle de réapprobation est suffisamment lent pour que le figement n'ait pas bougé.

Troisièmement, la reproductibilité de la recherche. Les articles et évaluations internes de fin 2023 qui ont utilisé la variante d'instruction font souvent référence à cet instantané, qu'ils le disent explicitement ou non. Le figement permet à ces résultats de rester reproductibles.

Ce que signifie le calendrier d'obsolescence

C'est l'un des instantanés datés encore résolvables les plus anciens de la gamme OpenAI. Les horizons d'obsolescence pour les instantanés datés s'étendent de douze à dix-huit mois selon le calendrier typique d'OpenAI. Septembre 2023 est bien au-delà de l'extrémité précoce de cette fenêtre. Le fait que le point de terminaison réponde encore aujourd'hui n'est pas une garantie qu'il répondra demain.

L'urgence de la migration est réelle. Planifiez-la activement. Définissez un rappel de calendrier. Notez que la cible de migration n'est pas un autre instantané d'instruction — la surface de l'API Completions est en voie d'abandon, donc la migration se fait vers l'interface de dialogue sur un modèle actuel, avec le travail architectural que cela implique.

Migration

Le même schéma qui s'applique à la variante d'instruction plus large s'applique ici, avec la contrainte supplémentaire que vous migrez depuis un instantané figé plutôt que depuis l'étiquette flottante.

Pour les charges de travail figées sur les distributions logprob, évaluez si le travail en aval peut passer à la fonctionnalité de sorties structurées strictes sur les modèles OpenAI actuels. L'application du schéma au niveau de l'inférence est souvent un remplacement plus propre pour l'échantillonnage conscient des logprob que de chercher un modèle d'instruction successeur qui n'existe pas.

Pour les charges de travail figées par conformité, le cycle de réapprobation fait partie du coût de migration. Commencez la conversation avec les auditeurs avant que la date d'obsolescence soit annoncée ; le faire sous pression temporelle est plus coûteux.

Pour les charges de travail figées pour la reproductibilité de la recherche, la réponse pratique est de publier des chiffres de base par rapport à un modèle actuel aux côtés des chiffres historiques, puis de faire la transition du pipeline de production. Les résultats historiques restent reproductibles par rapport aux instantanés archivés et aux sorties enregistrées ; le système en direct s'exécute sur les poids actuels.

Pour le contexte d'instruction flottant, consultez gpt-3.5-turbo-instruct. Pour la gamme OpenAI actuelle, consultez GPT-4.1 et GPT-4o mini.

Que faire aujourd'hui

Si cet identifiant est encore dans votre code, les étapes sont concrètes.

Premièrement, trouvez le site d'appel et documentez pourquoi le figement existe. Les raisons ci-dessus sont les plus courantes ; la raison de votre équipe peut être plus spécifique.

Deuxièmement, effectuez une évaluation réelle par rapport à votre cible de migration candidate. Les modèles plus récents et l'interface de dialogue nécessitent un prompting différent ; transposer les schémas de l'ère d'instruction peut faire paraître un successeur pire qu'il ne l'est.

Troisièmement, planifiez le basculement pour une fenêtre de version de votre choix, pas sous la pression de l'obsolescence. L'instantané de septembre 2023 se situe à l'extrémité la plus ancienne de la gamme OpenAI. La date d'obsolescence est plus proche que la date de version.

Le choisir

Ne choisissez pas cet instantané pour de nouvelles constructions. Il est obsolète et la surface de l'API elle-même est en voie d'abandon.

Pour les intégrations existantes, la cible de migration est un modèle d'interface de dialogue actuel — GPT-4o mini pour le trafic de type dialogue, GPT-4.1 ou GPT-4.1 mini pour les charges de travail où le plafond de raisonnement 3.5 était déjà une contrainte. Planifiez délibérément.

Dernière révision technique : 2026-05-22 — Tokonomix.ai

Dernier test automatisé

27 mai 2026 · 21:57 UTC · Benchmark

Latence P50

—

Latence P95

—

Erreurs

1 / 6 exécutions

Dernière revue par Équipe Tokonomix·26 mai 2026