
gpt-3.5-turbo-1106 : l'instantané qui a introduit le mode JSON⚠️ Modèle déprécié. OpenAI a retiré ce modèle. Pour de nouveaux projets, consultez GPT-4o mini pour une utilisation générale économique ou GPT-4.1 pour un raisonnement plus robuste. Les intégrations existantes doivent planifier la migration avant la fermeture du point d'accès API.
gpt-3.5-turbo-1106 est l'instantané daté de GPT-3.5 Turbo publié le 6 novembre 2023. Il s'agissait de la version du DevDay d'OpenAI — le modèle qui a apporté le mode JSON, l'appel de fonctions parallèles et les paramètres de reproductibilité seed à la ligne 3.5.
Le modèle est désormais déprécié. L'identifiant épinglé se résout toujours, mais les nouvelles implémentations doivent cibler un modèle actuel.
Ce qui a été livré dans cette version
La version du 6 novembre 2023 concernait moins les améliorations des poids du modèle que les fonctionnalités de surface API. La ligne 3.5 atteignait une forme de maturité ; OpenAI a utilisé cette version pour ajouter les contrôles de déploiement que les équipes de production réclamaient.
Mode JSON. Avant 1106, obtenir du JSON fiable de 3.5 Turbo nécessitait de l'ingénierie de prompts et un analyseur défensif. La version 1106 a ajouté un indicateur qui contraignait la génération à produire du JSON valide. La contrainte n'était pas une application stricte de schéma — cela est venu plus tard — mais elle suffisait à rendre les sorties au format JSON fiables sans artifices au niveau de la couche prompt. Pour les pipelines d'extraction de données qui contournaient l'ancien comportement, cela représentait une véritable simplification.
Appel de fonctions parallèles. Le support d'appel de fonctions précédent sur 3.5 était séquentiel — le modèle pouvait demander un appel d'outil à la fois, et vous deviez faire un aller-retour vers le modèle pour le suivant. La version 1106 a ajouté la capacité pour le modèle de demander plusieurs appels d'outils dans une seule réponse. Les boucles d'agent qui nécessitaient auparavant N allers-retours pour N appels d'outils pouvaient se réduire à un seul.
Reproductibilité. Le paramètre seed a été introduit dans cette version. Passez le même seed et le même prompt, obtenez la même sortie la plupart du temps. La partie "la plupart du temps" est importante — le paramètre améliorait la reproductibilité sans la garantir, car le non-déterminisme de la pile d'inférence se manifestait encore. Mais pour le travail d'évaluation et le débogage, le seed était suffisamment utile pour que la plupart des équipes de production aient commencé à l'utiliser.
Ce qui est resté identique
Le comportement sous-jacent du modèle. 1106 était la génération 3.5 sous le capot. Profondeur de raisonnement, factualité, calibration des refus — tout était à peu près identique aux instantanés immédiatement précédents. La version concernait l'ergonomie du déploiement, pas de rendre le modèle plus intelligent.
Fenêtre de contexte. 16 385 tokens. Suffisamment longue pour la plupart du trafic de chat, suffisamment courte pour que les charges de travail sur documents longs se heurtent régulièrement à cette limite.
Profil de coût. La tarification de la famille 3.5 continuait d'ancrer l'extrémité économique de la gamme OpenAI.
Pourquoi les équipes ont épinglé 1106
Pour les charges de travail qui dépendaient des fonctionnalités API introduites par cet instantané, 1106 était le bon choix d'épinglage durant la fin 2023 et jusqu'en 2024.
Pipelines dépendants du mode JSON. Toute équipe qui avait construit autour du nouveau mode JSON en novembre 2023 voulait la reproductibilité par rapport à l'instantané spécifique qui l'avait introduit. Le comportement était légèrement différent des versions ultérieures, et les analyseurs en aval ajustés à 1106 pouvaient régresser lors d'une mise à jour.
Boucles d'agent multi-outils. Les premiers frameworks d'agent qui profitaient de l'appel de fonctions parallèles ont épinglé 1106 parce que le comportement spécifique du modèle d'appel — quand le modèle groupait les appels, comment il les ordonnait, quels arguments il produisait — était sensible à l'instantané.
Évaluation dépendante de la reproductibilité. Les workflows de recherche et d'intégration continue qui ont commencé à utiliser le paramètre seed en novembre 2023 ont souvent épinglé 1106 parce que le comportement du paramètre était suffisamment nouveau pour que l'équipe ne veuille pas également faire varier l'instantané du modèle dans la même expérience.
L'instantané 0125, publié deux mois et demi plus tard, était une version plus aboutie du même ensemble de fonctionnalités. La plupart du trafic de production qui avait démarré sur 1106 a fini par migrer vers 0125 dans le trimestre.
Cibles de migration
Pour les charges de travail dépendantes du mode JSON, la fonctionnalité de sorties structurées strictes qui a été introduite dans l'instantané GPT-4o d'août 2024 et dans toute la famille GPT-4.1 est une meilleure cible qu'un autre instantané 3.5. L'application de schéma au niveau de la couche d'inférence est matériellement plus fiable que le mode JSON avec analyse défensive.
Pour les charges de travail de boucle d'agent construites sur l'appel de fonctions parallèles, le même modèle d'appel fonctionne sur GPT-4o, GPT-4.1 et la variante 4.1 mini. Le delta comportemental est suffisamment petit pour que la migration soit généralement un échange d'étiquette plus une réévaluation.
Pour les workflows d'évaluation dépendants de la reproductibilité, le paramètre seed est pris en charge dans toute la gamme actuelle d'OpenAI. Passer de 1106 à un modèle actuel signifie recalibrer les sorties d'évaluation avec seed par rapport au nouveau modèle ; le paramètre lui-même ne change pas.
Que faire aujourd'hui
Si 1106 est toujours épinglé dans votre pile, les actions à entreprendre sont similaires au reste de la famille 3.5. Auditez la charge de travail pour confirmer que l'épinglage mérite toujours d'être maintenu. Exécutez une évaluation mesurée par rapport à la cible de migration candidate. Planifiez le basculement pour une fenêtre de version de votre choix plutôt que sous la pression de la dépréciation.
Le cas spécifique 1106 à surveiller concerne le code en aval qui dépend du comportement précoce de l'appel de fonctions parallèles. Certains frameworks d'agent qui ont évolué avec cet instantané ont des cas limites dans la façon dont ils analysent les réponses multi-outils qui sont techniquement valides pour les modèles ultérieurs mais comportementalement différentes. Retestez les boucles, pas seulement le modèle.
Pour la comparaison inter-catégories, consultez /benchmarks/leaderboard. Pour le contexte de l'étiquette 3.5 flottante, voir GPT-3.5 Turbo.
Le choisir
Ne choisissez pas cet instantané pour de nouvelles implémentations. La famille 3.5 est dépréciée.
Pour les intégrations 1106 existantes, les successeurs naturels sont GPT-4o mini pour le trafic de chat général et GPT-4.1 mini ou GPT-4.1 complet pour les charges de travail où le plafond de raisonnement de la génération 3.5 était déjà une contrainte. Planifiez la migration avant l'arrivée de la date de dépréciation.
Dernière révision technique : 2026-05-22 — Tokonomix.ai

