
gpt-3.5-turbo-1106: de snapshot die JSON-modus introduceerde⚠️ Verouderd model. OpenAI heeft dit model uitgefaseerd. Voor nieuwe projecten, zie GPT-4o mini voor kostenefficiënt algemeen gebruik of GPT-4.1 voor sterkere redenering. Bestaande integraties moeten migratie plannen voordat het API-eindpunt wordt afgesloten.
gpt-3.5-turbo-1106 is de gedateerde snapshot van GPT-3.5 Turbo die werd uitgebracht op 6 november 2023. Het was de OpenAI DevDay-release — het model dat JSON-modus, parallelle functie-aanroepen en reproduceerbaarheid via seed-parameters naar de 3.5-lijn bracht.
Het model is nu verouderd. De vastgepinde identifier wordt nog steeds opgelost, maar nieuwe builds moeten zich richten op een actueel model.
Wat er in deze release zat
De release van 6 november 2023 ging minder over verbeteringen aan de modelgewichten en meer over API-oppervlakfunctionaliteiten. De 3.5-lijn bereikte een soort volwassenheid; OpenAI gebruikte deze release om de deployment-time controls toe te voegen waar productieteams om hadden gevraagd.
JSON-modus. Vóór 1106 betekende het verkrijgen van betrouwbare JSON uit 3.5 Turbo prompt engineering en een defensieve parser. De 1106-release voegde een vlag toe die generatie beperkte tot geldige JSON. De beperking was geen strikte schema-afdwinging — dat kwam later — maar het was genoeg om JSON-vormige outputs betrouwbaar te maken zonder prompt-layer-trucs. Voor data-extractiepipelines die de oudere gedragingen hadden moeten omzeilen, was dit een echte vereenvoudiging.
Parallelle functie-aanroepen. Eerdere ondersteuning voor functie-aanroepen op 3.5 was sequentieel — het model kon één tool call per keer aanvragen, en je moest terug naar het model voor de volgende. De 1106-release voegde het vermogen toe voor het model om meerdere tool calls in één enkele response aan te vragen. Agent-loops die eerder N round trips nodig hadden voor N tool calls konden samenvouwen tot één.
Reproduceerbaarheid. De seed-parameter werd in deze release geïntroduceerd. Geef dezelfde seed en dezelfde prompt, krijg meestal dezelfde output. Het "meestal"-gedeelte is belangrijk — de parameter verbeterde reproduceerbaarheid zonder het te garanderen, omdat non-determinisme in de inference-stack er nog steeds doorheen lekte. Maar voor evaluatiewerk en debugging was de seed nuttig genoeg dat de meeste productieteams ermee begonnen te werken.
Wat hetzelfde bleef
Het onderliggende modelgedrag. 1106 was de 3.5-generatie onder de motorkap. Redeneringdiepte, feitelijkheid, weigering-kalibratie — allemaal ongeveer hetzelfde als de snapshots direct ervoor. De release ging over deployment-ergonomie, niet over het slimmer maken van het model.
Contextvenster. 16.385 tokens. Lang genoeg voor de meeste chatverkeer, kort genoeg dat workloads met lange documenten regelmatig tegen de limiet aanliepen.
Kostenprofiel. De 3.5-familie-prijsstelling bleef het goedkope uiteinde van de OpenAI-lineup verankeren.
Waarom teams op 1106 vastzetten
Voor workloads die afhankelijk waren van de API-functionaliteiten die deze snapshot introduceerde, was 1106 de juiste pin tijdens eind 2023 en in 2024.
JSON-modus-afhankelijke pipelines. Elk team dat rond de nieuwe JSON-modus in november 2023 bouwde, wilde reproduceerbaarheid tegen de specifieke snapshot die het introduceerde. Het gedrag was enigszins verschillend van latere releases, en downstream parsers die op 1106 waren afgestemd, konden regressie vertonen bij een update.
Multi-tool agent-loops. Vroege agent-frameworks die gebruik maakten van parallelle functie-aanroepen pinten op 1106 omdat het specifieke gedrag van het aanroeppatroon — wanneer het model calls batched, hoe het ze ordende, welke argumenten het produceerde — gevoelig was voor de snapshot.
Reproduceerbaarheid-afhankelijke evaluatie. Onderzoeks- en CI-workflows die in november 2023 begonnen met het gebruik van de seed-parameter pinten vaak op 1106 omdat het gedrag van de parameter nieuw genoeg was dat het team ook niet de model-snapshot in hetzelfde experiment wilde variëren.
De 0125-snapshot, uitgebracht tweeënhalve maand later, was een meer gepolijste versie van dezelfde functieset. De meeste productieverkeer dat op 1106 startte, eindigde binnen een kwartaal met verhuizen naar 0125.
Migratiedoelen
Voor JSON-modus-afhankelijke workloads is de strikte structured-outputs-functionaliteit die in de GPT-4o-snapshot van augustus 2024 en in de GPT-4.1-familie werd geïntroduceerd, het betere doel dan een andere 3.5-snapshot. Schema-afdwinging op de inference-laag is materieel betrouwbaarder dan JSON-modus-met-defensief-parsen.
Voor agent-loop-workloads gebouwd op parallelle functie-aanroepen werkt hetzelfde aanroeppatroon op GPT-4o, GPT-4.1 en de 4.1 mini-variant. De gedragsdelta is klein genoeg dat de migratie meestal een tag-swap plus een her-evaluatie is.
Voor reproduceerbaarheid-afhankelijke evaluatie-workflows wordt de seed-parameter ondersteund in de hele huidige OpenAI-lineup. Verhuizen van 1106 naar een actueel model betekent het opnieuw baselinen van de seeded evaluatie-outputs tegen het nieuwe model; de parameter zelf verandert niet.
Wat vandaag te doen
Als 1106 nog steeds vastgepind is in je stack, komen de actie-items overeen met de rest van de 3.5-familie. Controleer de workload om te bevestigen dat de pin zijn nut nog steeds verdient. Voer een gemeten evaluatie uit tegen het kandidaat-migratiedoel. Plan de cutover voor een releasevenster van je eigen keuze in plaats van onder deprecatiedruk.
Het specifieke 1106-geval om op te letten is downstream code die afhankelijk is van het vroege parallelle-functie-aanroepgedrag. Sommige agent-frameworks die tegen deze snapshot zijn opgegroeid, hebben edge cases in hoe ze multi-tool responses parsen die technisch geldig zijn tegen latere modellen maar gedragsmatig verschillend. Test de loops opnieuw, niet alleen het model.
Voor de cross-category vergelijking zie /benchmarks/leaderboard. Voor de zwevende 3.5-tag-context, zie GPT-3.5 Turbo.
Het kiezen
Kies deze snapshot niet voor nieuwe builds. De 3.5-familie is verouderd.
Voor bestaande 1106-integraties zijn de natuurlijke opvolgers GPT-4o mini voor algemeen chatverkeer en GPT-4.1 mini of volledige GPT-4.1 voor workloads waar het 3.5-generatie redeneringsplafond al een beperking was. Plan de migratie voordat de deprecatiedatum arriveert.
Laatste technische review: 2026-05-22 — Tokonomix.ai

