
gpt-3.5-turbo-1106: der Snapshot, der JSON-Modus einführte⚠️ Veraltetes Modell. OpenAI hat dieses Modell außer Betrieb genommen. Für neue Projekte siehe GPT-4o mini für kosteneffiziente allgemeine Nutzung oder GPT-4.1 für stärkeres Reasoning. Bestehende Integrationen sollten die Migration planen, bevor der API-Endpunkt eingestellt wird.
gpt-3.5-turbo-1106 ist der datierte Snapshot von GPT-3.5 Turbo, der am 6. November 2023 veröffentlicht wurde. Es war die OpenAI-DevDay-Veröffentlichung — das Modell, das JSON-Modus, paralleles Function Calling und Reproduzierbarkeits-Seed-Parameter in die 3.5-Linie brachte.
Das Modell ist jetzt veraltet. Die gepinnte Kennung löst immer noch auf, aber neue Builds sollten auf ein aktuelles Modell abzielen.
Was in dieser Version ausgeliefert wurde
Die Veröffentlichung vom 6. November 2023 ging weniger um Verbesserungen der Modellgewichte und mehr um API-Oberflächenfunktionen. Die 3.5-Linie erreichte eine Art Reife; OpenAI nutzte diese Veröffentlichung, um die Deployment-Zeit-Kontrollen hinzuzufügen, nach denen Produktionsteams gefragt hatten.
JSON-Modus. Vor 1106 bedeutete das Erhalten von zuverlässigem JSON aus 3.5 Turbo Prompt-Engineering und einen defensiven Parser. Die 1106-Veröffentlichung fügte ein Flag hinzu, das die Generierung auf gültiges JSON beschränkte. Die Beschränkung war keine strikte Schema-Durchsetzung — das kam später —, aber sie reichte aus, um JSON-förmige Ausgaben zuverlässig zu machen, ohne Prompt-Layer-Tricks. Für Datenextraktions-Pipelines, die das ältere Verhalten umgangen hatten, war dies eine echte Vereinfachung.
Paralleles Function Calling. Die frühere Function-Calling-Unterstützung auf 3.5 war sequenziell — das Modell konnte einen Tool-Aufruf nach dem anderen anfordern, und man musste für den nächsten zurück zum Modell gehen. Die 1106-Veröffentlichung fügte die Fähigkeit hinzu, dass das Modell mehrere Tool-Aufrufe in einer einzigen Antwort anfordern konnte. Agent-Loops, die zuvor N Roundtrips für N Tool-Aufrufe benötigten, konnten auf einen einzigen kollabieren.
Reproduzierbarkeit. Der seed-Parameter landete in dieser Version. Übergebe denselben Seed und denselben Prompt, erhalte dieselbe Ausgabe meistens. Der Teil „meistens" ist wichtig — der Parameter verbesserte die Reproduzierbarkeit, ohne sie zu garantieren, weil Nicht-Determinismus im Inference-Stack immer noch durchsickerte. Aber für Evaluierungsarbeit und Debugging war der Seed nützlich genug, dass die meisten Produktionsteams begannen, ihn zu verwenden.
Was gleich blieb
Das zugrundeliegende Modellverhalten. 1106 war die 3.5-Generation unter der Haube. Reasoning-Tiefe, Faktentreue, Ablehnungs-Kalibrierung — alles ungefähr dasselbe wie bei den Snapshots unmittelbar davor. Die Veröffentlichung drehte sich um Deployment-Ergonomie, nicht darum, das Modell intelligenter zu machen.
Kontextfenster. 16.385 Token. Lang genug für den meisten Chat-Traffic, kurz genug, dass Workloads mit langen Dokumenten regelmäßig an die Grenze stießen.
Kostenprofil. Die Preisgestaltung der 3.5-Familie verankerte weiterhin das günstige Ende der OpenAI-Produktpalette.
Warum Teams auf 1106 pinnten
Für Workloads, die von den API-Funktionen abhingen, die dieser Snapshot einführte, war 1106 der richtige Pin Ende 2023 und bis ins Jahr 2024 hinein.
JSON-Modus-abhängige Pipelines. Jedes Team, das um den neuen JSON-Modus im November 2023 herum baute, wollte Reproduzierbarkeit gegen den spezifischen Snapshot, der ihn einführte. Das Verhalten unterschied sich leicht von späteren Versionen, und nachgelagerte Parser, die auf 1106 abgestimmt waren, konnten beim Bump regressieren.
Multi-Tool-Agent-Loops. Frühe Agent-Frameworks, die paralleles Function Calling nutzten, pinnten auf 1106, weil das spezifische Verhalten des Aufrufmusters — wann das Modell Aufrufe bündelte, wie es sie ordnete, welche Argumente es produzierte — empfindlich auf den Snapshot reagierte.
Reproduzierbarkeits-abhängige Evaluierung. Forschungs- und CI-Workflows, die den Seed-Parameter im November 2023 zu verwenden begannen, pinnten oft auf 1106, weil das Verhalten des Parameters neu genug war, dass das Team nicht auch den Modell-Snapshot im selben Experiment variieren wollte.
Der 0125-Snapshot, der zweieinhalb Monate später veröffentlicht wurde, war eine polierte Version desselben Feature-Sets. Der meiste Produktions-Traffic, der auf 1106 begann, migrierte innerhalb eines Quartals zu 0125.
Migrationsziele
Für JSON-Modus-abhängige Workloads ist die strikte Structured-Outputs-Funktion, die im GPT-4o-Snapshot vom August 2024 und über die GPT-4.1-Familie hinweg landete, das bessere Ziel als ein weiterer 3.5-Snapshot. Schema-Durchsetzung auf der Inference-Ebene ist materiell zuverlässiger als JSON-Modus-mit-defensivem-Parsing.
Für Agent-Loop-Workloads, die auf parallelem Function Calling aufgebaut sind, funktioniert dasselbe Aufrufmuster auf GPT-4o, GPT-4.1 und der 4.1-Mini-Variante. Das Verhaltens-Delta ist klein genug, dass die Migration normalerweise ein Tag-Swap plus eine Re-Evaluierung ist.
Für Reproduzierbarkeits-abhängige Eval-Workflows wird der Seed-Parameter über die aktuelle OpenAI-Produktpalette hinweg unterstützt. Der Wechsel von 1106 zu einem aktuellen Modell bedeutet, die geseedeten Eval-Ausgaben gegen das neue Modell neu zu basieren; der Parameter selbst ändert sich nicht.
Was heute zu tun ist
Wenn 1106 immer noch in Ihrem Stack gepinnt ist, spiegeln die Aktionspunkte den Rest der 3.5-Familie wider. Prüfen Sie den Workload, um zu bestätigen, dass der Pin sich immer noch lohnt. Führen Sie eine gemessene Evaluierung gegen das Kandidaten-Migrationsziel durch. Planen Sie den Übergang für ein Release-Fenster Ihrer Wahl und nicht unter Deprecation-Druck.
Der spezifische 1106-Fall, auf den man achten sollte, ist nachgelagerter Code, der vom frühen Parallel-Function-Calling-Verhalten abhängt. Einige Agent-Frameworks, die gegen diesen Snapshot gewachsen sind, haben Grenzfälle darin, wie sie Multi-Tool-Antworten parsen, die technisch gegen spätere Modelle gültig sind, aber sich verhaltenstechnisch unterscheiden. Testen Sie die Loops erneut, nicht nur das Modell.
Für den kategorieübergreifenden Vergleich siehe /benchmarks/leaderboard. Für den Kontext des schwebenden 3.5-Tags siehe GPT-3.5 Turbo.
Auswahl dieses Modells
Wählen Sie diesen Snapshot nicht für neue Builds. Die 3.5-Familie ist veraltet.
Für bestehende 1106-Integrationen sind die natürlichen Nachfolger GPT-4o mini für allgemeinen Chat-Traffic und GPT-4.1 mini oder volles GPT-4.1 für Workloads, bei denen die Reasoning-Obergrenze der 3.5-Generation bereits eine Einschränkung war. Planen Sie die Migration, bevor das Deprecation-Datum eintrifft.
Letzte technische Überprüfung: 2026-05-22 — Tokonomix.ai

