Aller au contenu
Fonctionne en :USCréé en :United States
OpenAI

gpt-3.5-turbo-1106

Équipe éditoriale Tokonomix·Relu par Mes Kalkan··

GPT-3.5 Turbo 1106 est un grand modèle de langage développé par OpenAI, lancé en novembre 2023 dans le cadre de la famille GPT-3.5. Ce modèle représente une amélioration itérative par rapport aux versions antérieures de GPT-3.5, incorporant des capacités améliorées de suivi d'instructions et des performances accrues sur diverses tâches de traitement du langage naturel. Il utilise une architecture basée sur des transformers entraînée sur des données textuelles internet diversifiées, bien qu'OpenAI n'ait pas divulgué publiquement le nombre exact de paramètres ni les spécifications détaillées d'entraînement. Le modèle est conçu pour des applications de génération de texte à usage général, notamment l'IA conversationnelle, la création de contenu, la synthèse, la traduction et les tâches de questions-réponses. Il traite les entrées textuelles et génère des réponses de type humain basées sur les schémas appris pendant l'entraînement. GPT-3.5 Turbo 1106 prend en charge les interactions textuelles standard et peut gérer des instructions complexes tout en maintenant le contexte au fil de conversations à plusieurs tours. Le modèle démontre des compétences dans plusieurs domaines et langues, bien que les performances puissent varier selon la tâche spécifique et la langue. Au sein de la gamme de modèles d'OpenAI, GPT-3.5 Turbo 1106 se situe en dessous de la série plus avancée GPT-4 en termes de capacités et de performances de raisonnement. Il constitue une option performante pour les applications où la sophistication supplémentaire des modèles GPT-4 n'est pas nécessaire. Le modèle est accessible via l'API d'OpenAI et a été intégré dans diverses applications et services. Cette version a remplacé les itérations antérieures de GPT-3.5 Turbo, offrant une fiabilité améliorée et des fonctionnalités d'appel de fonctions pour les développeurs créant des applications alimentées par l'IA.

GPT-3.5 Turbo 1106 représente l'équilibre optimal entre performance et accessibilité dans l'écosystème OpenAI de fin 2023, offrant des améliorations notables dans le suivi d'instructions par rapport aux versions antérieures.

Analyse comparative Tokonomix
Section 01

Scores de qualité

Résultats d'évaluation issus des notations du modèle juge sur diverses catégories de tâches. Les scores reflètent la cohérence, la précision et le suivi des instructions.

100
Génération de code
98
Multilingue
100
Raisonnement
Section 02

Historique des tarifs

Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.

💰
Tarifs API — gpt-3.5-turbo-1106
$1.00 par 1M de tokens d'entrée
$2.00 par 1M de tokens de sortie
≈ $0.0010 par conversation typique (800 tokens)
Prix entrée vs sortie (par 1M de tokens)
par 1M de tokens d'entrée$1.00
par 1M de tokens de sortie$2.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.00

input / 1M

— stable

$2.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Section 03

Forces & faiblesses

Basé sur les résultats de benchmarks et les retours communautaires agrégés sur des cas d'usage réels.

Forces

Suivi d'instructions nettement amélioréConversations multi-tours cohérentesSupport multilingue robusteTemps de réponse rapideIntégration API mature et stablePolyvalence sur tâches variéesÉcosystème d'outils bien documentéRapport qualité-prix favorable

Faiblesses

Raisonnement complexe limité vs GPT-4Date de coupure des connaissancesAbsence de capacités multimodalesCalculs mathématiques moins fiables
Section 04

Capacités

toolssource: litellmparallel toolsprompt cachingmax output tokens: 4096
Section 05

Questions fréquentes

La version 1106 apporte des améliorations significatives dans le suivi d'instructions, permettant au modèle de mieux comprendre et exécuter des directives complexes. Les performances sur les tâches structurées et les formats de sortie spécifiques ont été particulièrement renforcées.

Pour les équipes recherchant un modèle fiable et éprouvé sans nécessiter les capacités de raisonnement avancées de GPT-4, cette version 1106 demeure un choix solide et économiquement pertinent.

Évaluation éditoriale Tokonomix
Section 06

Disponibilité

Disponibilité

Pas encore de données

Nous n'avons pas encore enregistré suffisamment d'appels API pour afficher les statistiques de disponibilité de ce modèle. Les données apparaîtront dès que le modèle reçoit du trafic en direct.

Section 07

Verdicts benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-581/100 · 76 runs
46 correct18 partial12 wrong61% accuracy
2026-06-14

New tool capabilities added; performance data still unavailable

The gpt-3.5-turbo-1106 model has received significant functional updates in this benchmark window, adding support for tools, parallel tool execution, and prompt caching capabilities. These additions expand the model's utility for developers building applications that require function calling and iterative workflows. However, the absence of performance data in both the current and previous benchmark windows makes it impossible to assess the model's actual execution quality, latency, or reliability characteristics. Without metrics on accuracy, response times, or comparative performance against other models in its class, users lack critical information needed for informed deployment decisions. The new capabilities represent important feature parity improvements, particularly the parallel tools functionality which can reduce latency in complex multi-step operations. Prompt caching may offer efficiency gains for applications with repetitive context. Despite these functional enhancements, the continued lack of benchmark results means the model's practical performance remains unverified through independent testing. Organizations considering this model should conduct their own evaluation testing to validate it meets their specific requirements for accuracy, speed, and cost effectiveness.

Quality

Latency p50

Test runs

0

Tool support added Parallel tools capability enabled Prompt caching now available No performance data available
Section 08

Profil complet du modèle

gpt-3.5-turbo-1106 — illustration 1

⚠️ Modèle déprécié. OpenAI a retiré ce modèle. Pour de nouveaux projets, consultez GPT-4o mini pour une utilisation générale économique ou GPT-4.1 pour un raisonnement plus robuste. Les intégrations existantes doivent planifier la migration avant la fermeture du point d'accès API.

gpt-3.5-turbo-1106 : l'instantané qui a introduit le mode JSON

gpt-3.5-turbo-1106 est l'instantané daté de GPT-3.5 Turbo publié le 6 novembre 2023. Il s'agissait de la version du DevDay d'OpenAI — le modèle qui a apporté le mode JSON, l'appel de fonctions parallèles et les paramètres de reproductibilité seed à la ligne 3.5.

Le modèle est désormais déprécié. L'identifiant épinglé se résout toujours, mais les nouvelles implémentations doivent cibler un modèle actuel.

Ce qui a été livré dans cette version

La version du 6 novembre 2023 concernait moins les améliorations des poids du modèle que les fonctionnalités de surface API. La ligne 3.5 atteignait une forme de maturité ; OpenAI a utilisé cette version pour ajouter les contrôles de déploiement que les équipes de production réclamaient.

Mode JSON. Avant 1106, obtenir du JSON fiable de 3.5 Turbo nécessitait de l'ingénierie de prompts et un analyseur défensif. La version 1106 a ajouté un indicateur qui contraignait la génération à produire du JSON valide. La contrainte n'était pas une application stricte de schéma — cela est venu plus tard — mais elle suffisait à rendre les sorties au format JSON fiables sans artifices au niveau de la couche prompt. Pour les pipelines d'extraction de données qui contournaient l'ancien comportement, cela représentait une véritable simplification.

Appel de fonctions parallèles. Le support d'appel de fonctions précédent sur 3.5 était séquentiel — le modèle pouvait demander un appel d'outil à la fois, et vous deviez faire un aller-retour vers le modèle pour le suivant. La version 1106 a ajouté la capacité pour le modèle de demander plusieurs appels d'outils dans une seule réponse. Les boucles d'agent qui nécessitaient auparavant N allers-retours pour N appels d'outils pouvaient se réduire à un seul.

Reproductibilité. Le paramètre seed a été introduit dans cette version. Passez le même seed et le même prompt, obtenez la même sortie la plupart du temps. La partie "la plupart du temps" est importante — le paramètre améliorait la reproductibilité sans la garantir, car le non-déterminisme de la pile d'inférence se manifestait encore. Mais pour le travail d'évaluation et le débogage, le seed était suffisamment utile pour que la plupart des équipes de production aient commencé à l'utiliser.

Ce qui est resté identique

Le comportement sous-jacent du modèle. 1106 était la génération 3.5 sous le capot. Profondeur de raisonnement, factualité, calibration des refus — tout était à peu près identique aux instantanés immédiatement précédents. La version concernait l'ergonomie du déploiement, pas de rendre le modèle plus intelligent.

Fenêtre de contexte. 16 385 tokens. Suffisamment longue pour la plupart du trafic de chat, suffisamment courte pour que les charges de travail sur documents longs se heurtent régulièrement à cette limite.

Profil de coût. La tarification de la famille 3.5 continuait d'ancrer l'extrémité économique de la gamme OpenAI.

Pourquoi les équipes ont épinglé 1106

Pour les charges de travail qui dépendaient des fonctionnalités API introduites par cet instantané, 1106 était le bon choix d'épinglage durant la fin 2023 et jusqu'en 2024.

Pipelines dépendants du mode JSON. Toute équipe qui avait construit autour du nouveau mode JSON en novembre 2023 voulait la reproductibilité par rapport à l'instantané spécifique qui l'avait introduit. Le comportement était légèrement différent des versions ultérieures, et les analyseurs en aval ajustés à 1106 pouvaient régresser lors d'une mise à jour.

Boucles d'agent multi-outils. Les premiers frameworks d'agent qui profitaient de l'appel de fonctions parallèles ont épinglé 1106 parce que le comportement spécifique du modèle d'appel — quand le modèle groupait les appels, comment il les ordonnait, quels arguments il produisait — était sensible à l'instantané.

Évaluation dépendante de la reproductibilité. Les workflows de recherche et d'intégration continue qui ont commencé à utiliser le paramètre seed en novembre 2023 ont souvent épinglé 1106 parce que le comportement du paramètre était suffisamment nouveau pour que l'équipe ne veuille pas également faire varier l'instantané du modèle dans la même expérience.

L'instantané 0125, publié deux mois et demi plus tard, était une version plus aboutie du même ensemble de fonctionnalités. La plupart du trafic de production qui avait démarré sur 1106 a fini par migrer vers 0125 dans le trimestre.

Cibles de migration

Pour les charges de travail dépendantes du mode JSON, la fonctionnalité de sorties structurées strictes qui a été introduite dans l'instantané GPT-4o d'août 2024 et dans toute la famille GPT-4.1 est une meilleure cible qu'un autre instantané 3.5. L'application de schéma au niveau de la couche d'inférence est matériellement plus fiable que le mode JSON avec analyse défensive.

Pour les charges de travail de boucle d'agent construites sur l'appel de fonctions parallèles, le même modèle d'appel fonctionne sur GPT-4o, GPT-4.1 et la variante 4.1 mini. Le delta comportemental est suffisamment petit pour que la migration soit généralement un échange d'étiquette plus une réévaluation.

Pour les workflows d'évaluation dépendants de la reproductibilité, le paramètre seed est pris en charge dans toute la gamme actuelle d'OpenAI. Passer de 1106 à un modèle actuel signifie recalibrer les sorties d'évaluation avec seed par rapport au nouveau modèle ; le paramètre lui-même ne change pas.

Que faire aujourd'hui

Si 1106 est toujours épinglé dans votre pile, les actions à entreprendre sont similaires au reste de la famille 3.5. Auditez la charge de travail pour confirmer que l'épinglage mérite toujours d'être maintenu. Exécutez une évaluation mesurée par rapport à la cible de migration candidate. Planifiez le basculement pour une fenêtre de version de votre choix plutôt que sous la pression de la dépréciation.

Le cas spécifique 1106 à surveiller concerne le code en aval qui dépend du comportement précoce de l'appel de fonctions parallèles. Certains frameworks d'agent qui ont évolué avec cet instantané ont des cas limites dans la façon dont ils analysent les réponses multi-outils qui sont techniquement valides pour les modèles ultérieurs mais comportementalement différentes. Retestez les boucles, pas seulement le modèle.

Pour la comparaison inter-catégories, consultez /benchmarks/leaderboard. Pour le contexte de l'étiquette 3.5 flottante, voir GPT-3.5 Turbo.

Le choisir

Ne choisissez pas cet instantané pour de nouvelles implémentations. La famille 3.5 est dépréciée.

Pour les intégrations 1106 existantes, les successeurs naturels sont GPT-4o mini pour le trafic de chat général et GPT-4.1 mini ou GPT-4.1 complet pour les charges de travail où le plafond de raisonnement de la génération 3.5 était déjà une contrainte. Planifiez la migration avant l'arrivée de la date de dépréciation.

Dernière révision technique : 2026-05-22 — Tokonomix.ai

gpt-3.5-turbo-1106 — illustration 2gpt-3.5-turbo-1106 — illustration 3
Dernier test automatisé
14 juin 2026 · 04:56 UTC · Benchmark
Latence P50
1328 ms
Latence P95
Erreurs
0 / 6 exécutions
Dernière revue par Équipe Tokonomix·26 mai 2026