Quand devrais-je choisir ce modèle plutôt que GPT-4 ?

GPT-3.5 Turbo 1106 convient parfaitement aux applications conversationnelles, à la génération de contenu standard, et aux tâches de classification ou de résumé où le raisonnement avancé n'est pas critique. Si votre cas d'usage nécessite un raisonnement logique complexe, de l'analyse approfondie ou une précision maximale, GPT-4 sera préférable.

Le modèle peut-il traiter des documents ou des images ?

Non, GPT-3.5 Turbo 1106 est exclusivement un modèle texte. Il ne prend pas en charge l'analyse d'images, de PDF ou d'autres formats multimodaux. Pour ces besoins, il faudra se tourner vers GPT-4 Vision ou d'autres modèles multimodaux.

Quelle est la fiabilité du modèle pour des applications en production ?

GPT-3.5 Turbo 1106 bénéficie d'une API mature et stable, largement déployée dans des milliers d'applications. OpenAI offre des garanties de disponibilité et un historique de fiabilité solide. Néanmoins, comme tout modèle génératif, une validation des sorties reste recommandée pour les cas d'usage critiques.

Le modèle est-il toujours maintenu par OpenAI ?

Bien que des versions plus récentes de GPT-3.5 Turbo et GPT-4 soient disponibles, la version 1106 reste accessible via l'API OpenAI. Toutefois, OpenAI encourage progressivement la migration vers des versions plus récentes pour bénéficier des dernières améliorations.

Tier C — Spécialiste

Fonctionne en :USCréé en :United States

OpenAI

gpt-3.5-turbo-1106

Tier C — Spécialiste

Équipe éditoriale Tokonomix·Relu par Mes Kalkan·Publié le 22 mai 2026·Dernière relecture 26 mai 2026

GPT-3.5 Turbo 1106 est un grand modèle de langage développé par OpenAI, lancé en novembre 2023 dans le cadre de la famille GPT-3.5. Ce modèle représente une amélioration itérative par rapport aux versions antérieures de GPT-3.5, incorporant des capacités améliorées de suivi d'instructions et des performances accrues sur diverses tâches de traitement du langage naturel. Il utilise une architecture basée sur des transformers entraînée sur des données textuelles internet diversifiées, bien qu'OpenAI n'ait pas divulgué publiquement le nombre exact de paramètres ni les spécifications détaillées d'entraînement. Le modèle est conçu pour des applications de génération de texte à usage général, notamment l'IA conversationnelle, la création de contenu, la synthèse, la traduction et les tâches de questions-réponses. Il traite les entrées textuelles et génère des réponses de type humain basées sur les schémas appris pendant l'entraînement. GPT-3.5 Turbo 1106 prend en charge les interactions textuelles standard et peut gérer des instructions complexes tout en maintenant le contexte au fil de conversations à plusieurs tours. Le modèle démontre des compétences dans plusieurs domaines et langues, bien que les performances puissent varier selon la tâche spécifique et la langue. Au sein de la gamme de modèles d'OpenAI, GPT-3.5 Turbo 1106 se situe en dessous de la série plus avancée GPT-4 en termes de capacités et de performances de raisonnement. Il constitue une option performante pour les applications où la sophistication supplémentaire des modèles GPT-4 n'est pas nécessaire. Le modèle est accessible via l'API d'OpenAI et a été intégré dans diverses applications et services. Cette version a remplacé les itérations antérieures de GPT-3.5 Turbo, offrant une fiabilité améliorée et des fonctionnalités d'appel de fonctions pour les développeurs créant des applications alimentées par l'IA.

GPT-3.5 Turbo 1106 représente l'équilibre optimal entre performance et accessibilité dans l'écosystème OpenAI de fin 2023, offrant des améliorations notables dans le suivi d'instructions par rapport aux versions antérieures.
— Analyse comparative Tokonomix

Section 01

Scores de qualité

Résultats d'évaluation issus des notations du modèle juge sur diverses catégories de tâches. Les scores reflètent la cohérence, la précision et le suivi des instructions.

Créatif

Factuel

100

Multilingue

Raisonnement

Section 02

Historique des tarifs

Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.

💰

Tarifs API — gpt-3.5-turbo-1106

$1.00 par 1M de tokens d'entrée

$2.00 par 1M de tokens de sortie

≈ $0.0010 par conversation typique (800 tokens)

Prix entrée vs sortie (par 1M de tokens)

par 1M de tokens d'entrée$1.00

par 1M de tokens de sortie$2.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.00

input / 1M

— stable

$2.00

output / 1M

— stable

2026-05-242026-06-282026-07-26

Input

Output

Price change

⟳ synced weekly

Section 03

Forces & faiblesses

Basé sur les résultats de benchmarks et les retours communautaires agrégés sur des cas d'usage réels.

Forces

Suivi d'instructions nettement amélioréConversations multi-tours cohérentesSupport multilingue robusteTemps de réponse rapideIntégration API mature et stablePolyvalence sur tâches variéesÉcosystème d'outils bien documentéRapport qualité-prix favorable

Faiblesses

Raisonnement complexe limité vs GPT-4Date de coupure des connaissancesAbsence de capacités multimodalesCalculs mathématiques moins fiables

Section 04

Capacités

toolssource: litellmparallel toolsprompt cachingmax output tokens: 4096

Section 05

Questions fréquentes

La version 1106 apporte des améliorations significatives dans le suivi d'instructions, permettant au modèle de mieux comprendre et exécuter des directives complexes. Les performances sur les tâches structurées et les formats de sortie spécifiques ont été particulièrement renforcées.

Pour les équipes recherchant un modèle fiable et éprouvé sans nécessiter les capacités de raisonnement avancées de GPT-4, cette version 1106 demeure un choix solide et économiquement pertinent.
— Évaluation éditoriale Tokonomix

Section 06

Disponibilité

Pas encore de données

Nous n'avons pas encore enregistré suffisamment d'appels API pour afficher les statistiques de disponibilité de ce modèle. Les données apparaîtront dès que le modèle reçoit du trafic en direct.

Section 07

Verdicts benchmark Tokonomix

⚖️

Endorsed by 2 judges

Independent LLM judges evaluated this model on our weekly intelligence tests

cohere/command-a100/100 · 1 runs

1 correct0 partial0 wrong100% accuracy

claude-sonnet-4-584/100 · 111 runs

76 correct18 partial17 wrong68% accuracy

● 2026-07-26

Tool calling capabilities added; no performance data available

GPT-3.5-turbo-1106 has gained several new capabilities since the previous benchmark window, most notably the addition of tools, parallel_tools, and prompt_caching features. These additions represent meaningful functional enhancements that expand the model's utility for developers building applications that require function calling and structured interactions. The parallel tools capability in particular allows for more efficient multi-step workflows. However, the absence of performance metrics in both the current and previous benchmark windows makes it impossible to assess how these new features impact the model's actual task performance, response quality, latency, or throughput. Without concrete benchmark data on accuracy, reasoning ability, or speed, users cannot determine whether this version represents an improvement, regression, or lateral move in core model performance compared to earlier iterations. The model continues to serve as OpenAI's faster, more cost-effective option in the GPT-3.5 family, but potential users should be aware that the lack of standardized benchmark results limits the ability to make informed comparisons with competing models or to validate fitness for specific use cases.

Quality

—

Latency p50

—

Test runs

✓ Tool calling support added✓ Parallel tools capability enabled✓ Prompt caching now available✗ No performance metrics available

Section 08

Profil complet du modèle

⚠️ Modèle déprécié. OpenAI a retiré ce modèle. Pour de nouveaux projets, consultez GPT-4o mini pour une utilisation générale économique ou GPT-4.1 pour un raisonnement plus robuste. Les intégrations existantes doivent planifier la migration avant la fermeture du point d'accès API.

gpt-3.5-turbo-1106 : l'instantané qui a introduit le mode JSON

gpt-3.5-turbo-1106 est l'instantané daté de GPT-3.5 Turbo publié le 6 novembre 2023. Il s'agissait de la version du DevDay d'OpenAI — le modèle qui a apporté le mode JSON, l'appel de fonctions parallèles et les paramètres de reproductibilité seed à la ligne 3.5.

Le modèle est désormais déprécié. L'identifiant épinglé se résout toujours, mais les nouvelles implémentations doivent cibler un modèle actuel.

Ce qui a été livré dans cette version

La version du 6 novembre 2023 concernait moins les améliorations des poids du modèle que les fonctionnalités de surface API. La ligne 3.5 atteignait une forme de maturité ; OpenAI a utilisé cette version pour ajouter les contrôles de déploiement que les équipes de production réclamaient.

Mode JSON. Avant 1106, obtenir du JSON fiable de 3.5 Turbo nécessitait de l'ingénierie de prompts et un analyseur défensif. La version 1106 a ajouté un indicateur qui contraignait la génération à produire du JSON valide. La contrainte n'était pas une application stricte de schéma — cela est venu plus tard — mais elle suffisait à rendre les sorties au format JSON fiables sans artifices au niveau de la couche prompt. Pour les pipelines d'extraction de données qui contournaient l'ancien comportement, cela représentait une véritable simplification.

Appel de fonctions parallèles. Le support d'appel de fonctions précédent sur 3.5 était séquentiel — le modèle pouvait demander un appel d'outil à la fois, et vous deviez faire un aller-retour vers le modèle pour le suivant. La version 1106 a ajouté la capacité pour le modèle de demander plusieurs appels d'outils dans une seule réponse. Les boucles d'agent qui nécessitaient auparavant N allers-retours pour N appels d'outils pouvaient se réduire à un seul.

Reproductibilité. Le paramètre seed a été introduit dans cette version. Passez le même seed et le même prompt, obtenez la même sortie la plupart du temps. La partie "la plupart du temps" est importante — le paramètre améliorait la reproductibilité sans la garantir, car le non-déterminisme de la pile d'inférence se manifestait encore. Mais pour le travail d'évaluation et le débogage, le seed était suffisamment utile pour que la plupart des équipes de production aient commencé à l'utiliser.

Ce qui est resté identique

Le comportement sous-jacent du modèle. 1106 était la génération 3.5 sous le capot. Profondeur de raisonnement, factualité, calibration des refus — tout était à peu près identique aux instantanés immédiatement précédents. La version concernait l'ergonomie du déploiement, pas de rendre le modèle plus intelligent.

Fenêtre de contexte. 16 385 tokens. Suffisamment longue pour la plupart du trafic de chat, suffisamment courte pour que les charges de travail sur documents longs se heurtent régulièrement à cette limite.

Profil de coût. La tarification de la famille 3.5 continuait d'ancrer l'extrémité économique de la gamme OpenAI.

Pourquoi les équipes ont épinglé 1106

Pour les charges de travail qui dépendaient des fonctionnalités API introduites par cet instantané, 1106 était le bon choix d'épinglage durant la fin 2023 et jusqu'en 2024.

Pipelines dépendants du mode JSON. Toute équipe qui avait construit autour du nouveau mode JSON en novembre 2023 voulait la reproductibilité par rapport à l'instantané spécifique qui l'avait introduit. Le comportement était légèrement différent des versions ultérieures, et les analyseurs en aval ajustés à 1106 pouvaient régresser lors d'une mise à jour.

Boucles d'agent multi-outils. Les premiers frameworks d'agent qui profitaient de l'appel de fonctions parallèles ont épinglé 1106 parce que le comportement spécifique du modèle d'appel — quand le modèle groupait les appels, comment il les ordonnait, quels arguments il produisait — était sensible à l'instantané.

Évaluation dépendante de la reproductibilité. Les workflows de recherche et d'intégration continue qui ont commencé à utiliser le paramètre seed en novembre 2023 ont souvent épinglé 1106 parce que le comportement du paramètre était suffisamment nouveau pour que l'équipe ne veuille pas également faire varier l'instantané du modèle dans la même expérience.

L'instantané 0125, publié deux mois et demi plus tard, était une version plus aboutie du même ensemble de fonctionnalités. La plupart du trafic de production qui avait démarré sur 1106 a fini par migrer vers 0125 dans le trimestre.

Cibles de migration

Pour les charges de travail dépendantes du mode JSON, la fonctionnalité de sorties structurées strictes qui a été introduite dans l'instantané GPT-4o d'août 2024 et dans toute la famille GPT-4.1 est une meilleure cible qu'un autre instantané 3.5. L'application de schéma au niveau de la couche d'inférence est matériellement plus fiable que le mode JSON avec analyse défensive.

Pour les charges de travail de boucle d'agent construites sur l'appel de fonctions parallèles, le même modèle d'appel fonctionne sur GPT-4o, GPT-4.1 et la variante 4.1 mini. Le delta comportemental est suffisamment petit pour que la migration soit généralement un échange d'étiquette plus une réévaluation.

Pour les workflows d'évaluation dépendants de la reproductibilité, le paramètre seed est pris en charge dans toute la gamme actuelle d'OpenAI. Passer de 1106 à un modèle actuel signifie recalibrer les sorties d'évaluation avec seed par rapport au nouveau modèle ; le paramètre lui-même ne change pas.

Que faire aujourd'hui

Si 1106 est toujours épinglé dans votre pile, les actions à entreprendre sont similaires au reste de la famille 3.5. Auditez la charge de travail pour confirmer que l'épinglage mérite toujours d'être maintenu. Exécutez une évaluation mesurée par rapport à la cible de migration candidate. Planifiez le basculement pour une fenêtre de version de votre choix plutôt que sous la pression de la dépréciation.

Le cas spécifique 1106 à surveiller concerne le code en aval qui dépend du comportement précoce de l'appel de fonctions parallèles. Certains frameworks d'agent qui ont évolué avec cet instantané ont des cas limites dans la façon dont ils analysent les réponses multi-outils qui sont techniquement valides pour les modèles ultérieurs mais comportementalement différentes. Retestez les boucles, pas seulement le modèle.

Pour la comparaison inter-catégories, consultez /benchmarks/leaderboard. Pour le contexte de l'étiquette 3.5 flottante, voir GPT-3.5 Turbo.

Le choisir

Ne choisissez pas cet instantané pour de nouvelles implémentations. La famille 3.5 est dépréciée.

Pour les intégrations 1106 existantes, les successeurs naturels sont GPT-4o mini pour le trafic de chat général et GPT-4.1 mini ou GPT-4.1 complet pour les charges de travail où le plafond de raisonnement de la génération 3.5 était déjà une contrainte. Planifiez la migration avant l'arrivée de la date de dépréciation.

Dernière révision technique : 2026-05-22 — Tokonomix.ai

Dernier test automatisé

26 juil. 2026 · 05:30 UTC · Benchmark

Latence P50

1249 ms

Latence P95

—

Erreurs

0 / 6 exécutions

Dernière revue par Équipe Tokonomix·26 mai 2026