Naar inhoud
Draait in:USGemaakt in:United States
OpenAI

gpt-3.5-turbo-1106

Tokonomix-redactie·Gecontroleerd door Mes Kalkan··

GPT-3.5 Turbo 1106 is een groot taalmodel ontwikkeld door OpenAI, uitgebracht in november 2023 als onderdeel van de GPT-3.5-familie. Dit model vertegenwoordigt een iteratieve verbetering ten opzichte van eerdere GPT-3.5-versies, met verbeterde instructievolgmogelijkheden en betere prestaties bij verschillende natuurlijke taalverwerkingstaken. Het maakt gebruik van een transformer-gebaseerde architectuur getraind op diverse internettekstdata, hoewel OpenAI het exacte aantal parameters of gedetailleerde trainingsspecificaties niet openbaar heeft gemaakt. Het model is ontworpen voor algemene tekstgeneratietoepassingen, waaronder conversationele AI, contentcreatie, samenvatting, vertaling en vraag-en-antwoordtaken. Het verwerkt tekstinvoer en genereert mensachtige antwoorden op basis van patronen die tijdens de training zijn geleerd. GPT-3.5 Turbo 1106 ondersteunt standaard tekstgebaseerde interacties en kan complexe instructies verwerken terwijl het context behoudt gedurende gesprekken met meerdere beurten. Het model toont competentie over meerdere domeinen en talen, hoewel de prestaties kunnen variëren afhankelijk van de specifieke taak en taal. Binnen OpenAI's modelaanbod staat GPT-3.5 Turbo 1106 onder de geavanceerdere GPT-4-serie wat betreft mogelijkheden en redeneerprestaties. Het dient als een capabele optie voor toepassingen waar de extra verfijning van GPT-4-modellen niet vereist is. Het model is toegankelijk via OpenAI's API en is geïntegreerd in verschillende applicaties en services. Deze versie verving eerdere GPT-3.5 Turbo-iteraties en biedt verbeterde betrouwbaarheid en functieaanroepmogelijkheden voor ontwikkelaars die AI-aangedreven applicaties bouwen.

GPT-3.5 Turbo 1106 vertegenwoordigt de geoptimaliseerde middenklasse van OpenAI's portfolio: sneller en goedkoper dan GPT-4, maar met aanzienlijk verbeterde instructie-navolging ten opzichte van eerdere 3.5-versies.

Tokonomix modelanalyse
Sectie 01

Kwaliteitsscores

Evaluatieresultaten van judge-model beoordelingen over diverse taakcategorieën. Scores weerspiegelen coherentie, accuratesse en instructieopvolging.

100
Code generatie
98
Meertaligheid
100
Redeneren
Sectie 02

Prijsgeschiedenis

Directe provider-tarieven per miljoen tokens, plus een typische gespreks-kostschatting.

💰
API-tarieven — gpt-3.5-turbo-1106
$1.00 per 1M input-tokens
$2.00 per 1M output-tokens
≈ $0.0010 per typisch gesprek (800 tokens)
Input vs output prijs (per 1M tokens)
per 1M input-tokens$1.00
per 1M output-tokens$2.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.00

input / 1M

— stable

$2.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Sectie 03

Sterke & zwakke punten

Gebaseerd op benchmark-resultaten en geaggregeerde community-feedback over echte use-cases.

Sterke punten

Verbeterde instructie-navolgingSnelle responstijdenSterke conversationele capaciteitenMeertalige ondersteuningContext behoud in multi-turn dialogenBetrouwbare tekst samenvattingBreed geïntegreerd in applicatiesBewezen stabiliteit in productie

Zwakke punten

Beperktere redeneervaardigheden dan GPT-4Kennis beperkt tot trainingsdatumGeen native vision of audioLagere nauwkeurigheid bij complexe logica
Sectie 04

Mogelijkheden

toolssource: litellmparallel toolsprompt cachingmax output tokens: 4096
Sectie 05

Veelgestelde vragen

Kies voor dit model wanneer responstijd en kosten prioriteit hebben en je taak voornamelijk tekstgeneratie, samenvatting of eenvoudige conversatie betreft. Voor complexe redeneertaken, codering op hoog niveau of multimodale toepassingen is GPT-4 beter geschikt.

Voor toepassingen die consistente tekstgeneratie vereisen zonder de redeneerdiepte van GPT-4, blijft deze versie een solide keuze met bewezen betrouwbaarheid.

Tokonomix modelanalyse
Sectie 06

Beschikbaarheid

Beschikbaarheid

Nog geen meetdata

Er zijn nog niet genoeg API-aanroepen geregistreerd om beschikbaarheidsstatistieken voor dit model te tonen. Data verschijnt zodra het model live verkeer ontvangt.

Sectie 07

Tokonomix benchmark-oordelen

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-581/100 · 76 runs
46 correct18 partial12 wrong61% accuracy
2026-06-14

New tool capabilities added; performance data still unavailable

The gpt-3.5-turbo-1106 model has received significant functional updates in this benchmark window, adding support for tools, parallel tool execution, and prompt caching capabilities. These additions expand the model's utility for developers building applications that require function calling and iterative workflows. However, the absence of performance data in both the current and previous benchmark windows makes it impossible to assess the model's actual execution quality, latency, or reliability characteristics. Without metrics on accuracy, response times, or comparative performance against other models in its class, users lack critical information needed for informed deployment decisions. The new capabilities represent important feature parity improvements, particularly the parallel tools functionality which can reduce latency in complex multi-step operations. Prompt caching may offer efficiency gains for applications with repetitive context. Despite these functional enhancements, the continued lack of benchmark results means the model's practical performance remains unverified through independent testing. Organizations considering this model should conduct their own evaluation testing to validate it meets their specific requirements for accuracy, speed, and cost effectiveness.

Quality

Latency p50

Test runs

0

Tool support added Parallel tools capability enabled Prompt caching now available No performance data available
Sectie 08

Volledig modelprofiel

gpt-3.5-turbo-1106 — illustration 1

⚠️ Verouderd model. OpenAI heeft dit model uitgefaseerd. Voor nieuwe projecten, zie GPT-4o mini voor kostenefficiënt algemeen gebruik of GPT-4.1 voor sterkere redenering. Bestaande integraties moeten migratie plannen voordat het API-eindpunt wordt afgesloten.

gpt-3.5-turbo-1106: de snapshot die JSON-modus introduceerde

gpt-3.5-turbo-1106 is de gedateerde snapshot van GPT-3.5 Turbo die werd uitgebracht op 6 november 2023. Het was de OpenAI DevDay-release — het model dat JSON-modus, parallelle functie-aanroepen en reproduceerbaarheid via seed-parameters naar de 3.5-lijn bracht.

Het model is nu verouderd. De vastgepinde identifier wordt nog steeds opgelost, maar nieuwe builds moeten zich richten op een actueel model.

Wat er in deze release zat

De release van 6 november 2023 ging minder over verbeteringen aan de modelgewichten en meer over API-oppervlakfunctionaliteiten. De 3.5-lijn bereikte een soort volwassenheid; OpenAI gebruikte deze release om de deployment-time controls toe te voegen waar productieteams om hadden gevraagd.

JSON-modus. Vóór 1106 betekende het verkrijgen van betrouwbare JSON uit 3.5 Turbo prompt engineering en een defensieve parser. De 1106-release voegde een vlag toe die generatie beperkte tot geldige JSON. De beperking was geen strikte schema-afdwinging — dat kwam later — maar het was genoeg om JSON-vormige outputs betrouwbaar te maken zonder prompt-layer-trucs. Voor data-extractiepipelines die de oudere gedragingen hadden moeten omzeilen, was dit een echte vereenvoudiging.

Parallelle functie-aanroepen. Eerdere ondersteuning voor functie-aanroepen op 3.5 was sequentieel — het model kon één tool call per keer aanvragen, en je moest terug naar het model voor de volgende. De 1106-release voegde het vermogen toe voor het model om meerdere tool calls in één enkele response aan te vragen. Agent-loops die eerder N round trips nodig hadden voor N tool calls konden samenvouwen tot één.

Reproduceerbaarheid. De seed-parameter werd in deze release geïntroduceerd. Geef dezelfde seed en dezelfde prompt, krijg meestal dezelfde output. Het "meestal"-gedeelte is belangrijk — de parameter verbeterde reproduceerbaarheid zonder het te garanderen, omdat non-determinisme in de inference-stack er nog steeds doorheen lekte. Maar voor evaluatiewerk en debugging was de seed nuttig genoeg dat de meeste productieteams ermee begonnen te werken.

Wat hetzelfde bleef

Het onderliggende modelgedrag. 1106 was de 3.5-generatie onder de motorkap. Redeneringdiepte, feitelijkheid, weigering-kalibratie — allemaal ongeveer hetzelfde als de snapshots direct ervoor. De release ging over deployment-ergonomie, niet over het slimmer maken van het model.

Contextvenster. 16.385 tokens. Lang genoeg voor de meeste chatverkeer, kort genoeg dat workloads met lange documenten regelmatig tegen de limiet aanliepen.

Kostenprofiel. De 3.5-familie-prijsstelling bleef het goedkope uiteinde van de OpenAI-lineup verankeren.

Waarom teams op 1106 vastzetten

Voor workloads die afhankelijk waren van de API-functionaliteiten die deze snapshot introduceerde, was 1106 de juiste pin tijdens eind 2023 en in 2024.

JSON-modus-afhankelijke pipelines. Elk team dat rond de nieuwe JSON-modus in november 2023 bouwde, wilde reproduceerbaarheid tegen de specifieke snapshot die het introduceerde. Het gedrag was enigszins verschillend van latere releases, en downstream parsers die op 1106 waren afgestemd, konden regressie vertonen bij een update.

Multi-tool agent-loops. Vroege agent-frameworks die gebruik maakten van parallelle functie-aanroepen pinten op 1106 omdat het specifieke gedrag van het aanroeppatroon — wanneer het model calls batched, hoe het ze ordende, welke argumenten het produceerde — gevoelig was voor de snapshot.

Reproduceerbaarheid-afhankelijke evaluatie. Onderzoeks- en CI-workflows die in november 2023 begonnen met het gebruik van de seed-parameter pinten vaak op 1106 omdat het gedrag van de parameter nieuw genoeg was dat het team ook niet de model-snapshot in hetzelfde experiment wilde variëren.

De 0125-snapshot, uitgebracht tweeënhalve maand later, was een meer gepolijste versie van dezelfde functieset. De meeste productieverkeer dat op 1106 startte, eindigde binnen een kwartaal met verhuizen naar 0125.

Migratiedoelen

Voor JSON-modus-afhankelijke workloads is de strikte structured-outputs-functionaliteit die in de GPT-4o-snapshot van augustus 2024 en in de GPT-4.1-familie werd geïntroduceerd, het betere doel dan een andere 3.5-snapshot. Schema-afdwinging op de inference-laag is materieel betrouwbaarder dan JSON-modus-met-defensief-parsen.

Voor agent-loop-workloads gebouwd op parallelle functie-aanroepen werkt hetzelfde aanroeppatroon op GPT-4o, GPT-4.1 en de 4.1 mini-variant. De gedragsdelta is klein genoeg dat de migratie meestal een tag-swap plus een her-evaluatie is.

Voor reproduceerbaarheid-afhankelijke evaluatie-workflows wordt de seed-parameter ondersteund in de hele huidige OpenAI-lineup. Verhuizen van 1106 naar een actueel model betekent het opnieuw baselinen van de seeded evaluatie-outputs tegen het nieuwe model; de parameter zelf verandert niet.

Wat vandaag te doen

Als 1106 nog steeds vastgepind is in je stack, komen de actie-items overeen met de rest van de 3.5-familie. Controleer de workload om te bevestigen dat de pin zijn nut nog steeds verdient. Voer een gemeten evaluatie uit tegen het kandidaat-migratiedoel. Plan de cutover voor een releasevenster van je eigen keuze in plaats van onder deprecatiedruk.

Het specifieke 1106-geval om op te letten is downstream code die afhankelijk is van het vroege parallelle-functie-aanroepgedrag. Sommige agent-frameworks die tegen deze snapshot zijn opgegroeid, hebben edge cases in hoe ze multi-tool responses parsen die technisch geldig zijn tegen latere modellen maar gedragsmatig verschillend. Test de loops opnieuw, niet alleen het model.

Voor de cross-category vergelijking zie /benchmarks/leaderboard. Voor de zwevende 3.5-tag-context, zie GPT-3.5 Turbo.

Het kiezen

Kies deze snapshot niet voor nieuwe builds. De 3.5-familie is verouderd.

Voor bestaande 1106-integraties zijn de natuurlijke opvolgers GPT-4o mini voor algemeen chatverkeer en GPT-4.1 mini of volledige GPT-4.1 voor workloads waar het 3.5-generatie redeneringsplafond al een beperking was. Plan de migratie voordat de deprecatiedatum arriveert.

Laatste technische review: 2026-05-22 — Tokonomix.ai

gpt-3.5-turbo-1106 — illustration 2gpt-3.5-turbo-1106 — illustration 3
Laatste automatische test
14 jun 2026 · 04:56 UTC · Benchmark
P50 latency
1328 ms
P95 latency
Fouten
0 / 6 runs
Laatst beoordeeld door Tokonomix-team·26 mei 2026