Wat zijn de belangrijkste verbeteringen ten opzichte van eerdere GPT-3.5 versies?

De 1106-versie biedt verbeterde instructie-navolging, consistentere output-formatting en betere prestaties bij gestructureerde taken. Deze verbeteringen maken het model betrouwbaarder voor productietoepassingen die voorspelbare resultaten vereisen.

Ondersteunt dit model function calling en JSON mode?

Ja, GPT-3.5 Turbo 1106 ondersteunt function calling en kan gestructureerde JSON-output genereren, wat het geschikt maakt voor API-integraties en geautomatiseerde workflows.

Hoe verhoudt de contextvensterbreedte zich tot andere modellen?

GPT-3.5 Turbo 1106 biedt een standaard contextvenster dat geschikt is voor de meeste conversationele en documentverwerkingstaken, hoewel het kleiner is dan de uitgebreide context van nieuwere modellen in de GPT-4 familie.

Is dit model geschikt voor enterprise-productie-omgevingen?

Ja, GPT-3.5 Turbo 1106 is breed ingezet in productieomgevingen en biedt betrouwbare prestaties via OpenAI's API. Het combineert een goede balans tussen capaciteit, snelheid en stabiliteit voor bedrijfskritische toepassingen.

Tier C — Specialist

Draait in:USGemaakt in:United States

OpenAI

gpt-3.5-turbo-1106

Tier C — Specialist

Tokonomix-redactie·Gecontroleerd door Mes Kalkan·Gepubliceerd 22 mei 2026·Laatst gecontroleerd 26 mei 2026

GPT-3.5 Turbo 1106 is een groot taalmodel ontwikkeld door OpenAI, uitgebracht in november 2023 als onderdeel van de GPT-3.5-familie. Dit model vertegenwoordigt een iteratieve verbetering ten opzichte van eerdere GPT-3.5-versies, met verbeterde instructievolgmogelijkheden en betere prestaties bij verschillende natuurlijke taalverwerkingstaken. Het maakt gebruik van een transformer-gebaseerde architectuur getraind op diverse internettekstdata, hoewel OpenAI het exacte aantal parameters of gedetailleerde trainingsspecificaties niet openbaar heeft gemaakt. Het model is ontworpen voor algemene tekstgeneratietoepassingen, waaronder conversationele AI, contentcreatie, samenvatting, vertaling en vraag-en-antwoordtaken. Het verwerkt tekstinvoer en genereert mensachtige antwoorden op basis van patronen die tijdens de training zijn geleerd. GPT-3.5 Turbo 1106 ondersteunt standaard tekstgebaseerde interacties en kan complexe instructies verwerken terwijl het context behoudt gedurende gesprekken met meerdere beurten. Het model toont competentie over meerdere domeinen en talen, hoewel de prestaties kunnen variëren afhankelijk van de specifieke taak en taal. Binnen OpenAI's modelaanbod staat GPT-3.5 Turbo 1106 onder de geavanceerdere GPT-4-serie wat betreft mogelijkheden en redeneerprestaties. Het dient als een capabele optie voor toepassingen waar de extra verfijning van GPT-4-modellen niet vereist is. Het model is toegankelijk via OpenAI's API en is geïntegreerd in verschillende applicaties en services. Deze versie verving eerdere GPT-3.5 Turbo-iteraties en biedt verbeterde betrouwbaarheid en functieaanroepmogelijkheden voor ontwikkelaars die AI-aangedreven applicaties bouwen.

GPT-3.5 Turbo 1106 vertegenwoordigt de geoptimaliseerde middenklasse van OpenAI's portfolio: sneller en goedkoper dan GPT-4, maar met aanzienlijk verbeterde instructie-navolging ten opzichte van eerdere 3.5-versies.
— Tokonomix modelanalyse

Sectie 01

Kwaliteitsscores

Evaluatieresultaten van judge-model beoordelingen over diverse taakcategorieën. Scores weerspiegelen coherentie, accuratesse en instructieopvolging.

Creatief

Feitelijk

100

Meertaligheid

Redeneren

Sectie 02

Prijsgeschiedenis

Directe provider-tarieven per miljoen tokens, plus een typische gespreks-kostschatting.

💰

API-tarieven — gpt-3.5-turbo-1106

$1.00 per 1M input-tokens

$2.00 per 1M output-tokens

≈ $0.0010 per typisch gesprek (800 tokens)

Input vs output prijs (per 1M tokens)

per 1M input-tokens$1.00

per 1M output-tokens$2.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.00

input / 1M

— stable

$2.00

output / 1M

— stable

2026-05-242026-06-282026-07-26

Input

Output

Price change

⟳ synced weekly

Sectie 03

Sterke & zwakke punten

Gebaseerd op benchmark-resultaten en geaggregeerde community-feedback over echte use-cases.

Sterke punten

Verbeterde instructie-navolgingSnelle responstijdenSterke conversationele capaciteitenMeertalige ondersteuningContext behoud in multi-turn dialogenBetrouwbare tekst samenvattingBreed geïntegreerd in applicatiesBewezen stabiliteit in productie

Zwakke punten

Beperktere redeneervaardigheden dan GPT-4Kennis beperkt tot trainingsdatumGeen native vision of audioLagere nauwkeurigheid bij complexe logica

Sectie 04

Mogelijkheden

toolssource: litellmparallel toolsprompt cachingmax output tokens: 4096

Sectie 05

Veelgestelde vragen

Kies voor dit model wanneer responstijd en kosten prioriteit hebben en je taak voornamelijk tekstgeneratie, samenvatting of eenvoudige conversatie betreft. Voor complexe redeneertaken, codering op hoog niveau of multimodale toepassingen is GPT-4 beter geschikt.

Voor toepassingen die consistente tekstgeneratie vereisen zonder de redeneerdiepte van GPT-4, blijft deze versie een solide keuze met bewezen betrouwbaarheid.
— Tokonomix modelanalyse

Sectie 06

Beschikbaarheid

Nog geen meetdata

Er zijn nog niet genoeg API-aanroepen geregistreerd om beschikbaarheidsstatistieken voor dit model te tonen. Data verschijnt zodra het model live verkeer ontvangt.

Sectie 07

Tokonomix benchmark-oordelen

⚖️

Endorsed by 2 judges

Independent LLM judges evaluated this model on our weekly intelligence tests

cohere/command-a100/100 · 1 runs

1 correct0 partial0 wrong100% accuracy

claude-sonnet-4-584/100 · 111 runs

76 correct18 partial17 wrong68% accuracy

● 2026-07-26

Tool calling capabilities added; no performance data available

GPT-3.5-turbo-1106 has gained several new capabilities since the previous benchmark window, most notably the addition of tools, parallel_tools, and prompt_caching features. These additions represent meaningful functional enhancements that expand the model's utility for developers building applications that require function calling and structured interactions. The parallel tools capability in particular allows for more efficient multi-step workflows. However, the absence of performance metrics in both the current and previous benchmark windows makes it impossible to assess how these new features impact the model's actual task performance, response quality, latency, or throughput. Without concrete benchmark data on accuracy, reasoning ability, or speed, users cannot determine whether this version represents an improvement, regression, or lateral move in core model performance compared to earlier iterations. The model continues to serve as OpenAI's faster, more cost-effective option in the GPT-3.5 family, but potential users should be aware that the lack of standardized benchmark results limits the ability to make informed comparisons with competing models or to validate fitness for specific use cases.

Quality

—

Latency p50

—

Test runs

✓ Tool calling support added✓ Parallel tools capability enabled✓ Prompt caching now available✗ No performance metrics available

Sectie 08

Volledig modelprofiel

⚠️ Verouderd model. OpenAI heeft dit model uitgefaseerd. Voor nieuwe projecten, zie GPT-4o mini voor kostenefficiënt algemeen gebruik of GPT-4.1 voor sterkere redenering. Bestaande integraties moeten migratie plannen voordat het API-eindpunt wordt afgesloten.

gpt-3.5-turbo-1106: de snapshot die JSON-modus introduceerde

gpt-3.5-turbo-1106 is de gedateerde snapshot van GPT-3.5 Turbo die werd uitgebracht op 6 november 2023. Het was de OpenAI DevDay-release — het model dat JSON-modus, parallelle functie-aanroepen en reproduceerbaarheid via seed-parameters naar de 3.5-lijn bracht.

Het model is nu verouderd. De vastgepinde identifier wordt nog steeds opgelost, maar nieuwe builds moeten zich richten op een actueel model.

Wat er in deze release zat

De release van 6 november 2023 ging minder over verbeteringen aan de modelgewichten en meer over API-oppervlakfunctionaliteiten. De 3.5-lijn bereikte een soort volwassenheid; OpenAI gebruikte deze release om de deployment-time controls toe te voegen waar productieteams om hadden gevraagd.

JSON-modus. Vóór 1106 betekende het verkrijgen van betrouwbare JSON uit 3.5 Turbo prompt engineering en een defensieve parser. De 1106-release voegde een vlag toe die generatie beperkte tot geldige JSON. De beperking was geen strikte schema-afdwinging — dat kwam later — maar het was genoeg om JSON-vormige outputs betrouwbaar te maken zonder prompt-layer-trucs. Voor data-extractiepipelines die de oudere gedragingen hadden moeten omzeilen, was dit een echte vereenvoudiging.

Parallelle functie-aanroepen. Eerdere ondersteuning voor functie-aanroepen op 3.5 was sequentieel — het model kon één tool call per keer aanvragen, en je moest terug naar het model voor de volgende. De 1106-release voegde het vermogen toe voor het model om meerdere tool calls in één enkele response aan te vragen. Agent-loops die eerder N round trips nodig hadden voor N tool calls konden samenvouwen tot één.

Reproduceerbaarheid. De seed-parameter werd in deze release geïntroduceerd. Geef dezelfde seed en dezelfde prompt, krijg meestal dezelfde output. Het "meestal"-gedeelte is belangrijk — de parameter verbeterde reproduceerbaarheid zonder het te garanderen, omdat non-determinisme in de inference-stack er nog steeds doorheen lekte. Maar voor evaluatiewerk en debugging was de seed nuttig genoeg dat de meeste productieteams ermee begonnen te werken.

Wat hetzelfde bleef

Het onderliggende modelgedrag. 1106 was de 3.5-generatie onder de motorkap. Redeneringdiepte, feitelijkheid, weigering-kalibratie — allemaal ongeveer hetzelfde als de snapshots direct ervoor. De release ging over deployment-ergonomie, niet over het slimmer maken van het model.

Contextvenster. 16.385 tokens. Lang genoeg voor de meeste chatverkeer, kort genoeg dat workloads met lange documenten regelmatig tegen de limiet aanliepen.

Kostenprofiel. De 3.5-familie-prijsstelling bleef het goedkope uiteinde van de OpenAI-lineup verankeren.

Waarom teams op 1106 vastzetten

Voor workloads die afhankelijk waren van de API-functionaliteiten die deze snapshot introduceerde, was 1106 de juiste pin tijdens eind 2023 en in 2024.

JSON-modus-afhankelijke pipelines. Elk team dat rond de nieuwe JSON-modus in november 2023 bouwde, wilde reproduceerbaarheid tegen de specifieke snapshot die het introduceerde. Het gedrag was enigszins verschillend van latere releases, en downstream parsers die op 1106 waren afgestemd, konden regressie vertonen bij een update.

Multi-tool agent-loops. Vroege agent-frameworks die gebruik maakten van parallelle functie-aanroepen pinten op 1106 omdat het specifieke gedrag van het aanroeppatroon — wanneer het model calls batched, hoe het ze ordende, welke argumenten het produceerde — gevoelig was voor de snapshot.

Reproduceerbaarheid-afhankelijke evaluatie. Onderzoeks- en CI-workflows die in november 2023 begonnen met het gebruik van de seed-parameter pinten vaak op 1106 omdat het gedrag van de parameter nieuw genoeg was dat het team ook niet de model-snapshot in hetzelfde experiment wilde variëren.

De 0125-snapshot, uitgebracht tweeënhalve maand later, was een meer gepolijste versie van dezelfde functieset. De meeste productieverkeer dat op 1106 startte, eindigde binnen een kwartaal met verhuizen naar 0125.

Migratiedoelen

Voor JSON-modus-afhankelijke workloads is de strikte structured-outputs-functionaliteit die in de GPT-4o-snapshot van augustus 2024 en in de GPT-4.1-familie werd geïntroduceerd, het betere doel dan een andere 3.5-snapshot. Schema-afdwinging op de inference-laag is materieel betrouwbaarder dan JSON-modus-met-defensief-parsen.

Voor agent-loop-workloads gebouwd op parallelle functie-aanroepen werkt hetzelfde aanroeppatroon op GPT-4o, GPT-4.1 en de 4.1 mini-variant. De gedragsdelta is klein genoeg dat de migratie meestal een tag-swap plus een her-evaluatie is.

Voor reproduceerbaarheid-afhankelijke evaluatie-workflows wordt de seed-parameter ondersteund in de hele huidige OpenAI-lineup. Verhuizen van 1106 naar een actueel model betekent het opnieuw baselinen van de seeded evaluatie-outputs tegen het nieuwe model; de parameter zelf verandert niet.

Wat vandaag te doen

Als 1106 nog steeds vastgepind is in je stack, komen de actie-items overeen met de rest van de 3.5-familie. Controleer de workload om te bevestigen dat de pin zijn nut nog steeds verdient. Voer een gemeten evaluatie uit tegen het kandidaat-migratiedoel. Plan de cutover voor een releasevenster van je eigen keuze in plaats van onder deprecatiedruk.

Het specifieke 1106-geval om op te letten is downstream code die afhankelijk is van het vroege parallelle-functie-aanroepgedrag. Sommige agent-frameworks die tegen deze snapshot zijn opgegroeid, hebben edge cases in hoe ze multi-tool responses parsen die technisch geldig zijn tegen latere modellen maar gedragsmatig verschillend. Test de loops opnieuw, niet alleen het model.

Voor de cross-category vergelijking zie /benchmarks/leaderboard. Voor de zwevende 3.5-tag-context, zie GPT-3.5 Turbo.

Het kiezen

Kies deze snapshot niet voor nieuwe builds. De 3.5-familie is verouderd.

Voor bestaande 1106-integraties zijn de natuurlijke opvolgers GPT-4o mini voor algemeen chatverkeer en GPT-4.1 mini of volledige GPT-4.1 voor workloads waar het 3.5-generatie redeneringsplafond al een beperking was. Plan de migratie voordat de deprecatiedatum arriveert.

Laatste technische review: 2026-05-22 — Tokonomix.ai

Laatste automatische test

26 jul 2026 · 05:30 UTC · Benchmark

P50 latency

1249 ms

P95 latency

—

Fouten

0 / 6 runs

Laatst beoordeeld door Tokonomix-team·26 mei 2026