Zum Inhalt
Läuft in:USErstellt in:United States
OpenAI

gpt-3.5-turbo-1106

Tokonomix-Redaktionsteam·Geprüft von Mes Kalkan··

GPT-3.5 Turbo 1106 ist ein großes Sprachmodell, das von OpenAI entwickelt wurde und im November 2023 als Teil der GPT-3.5-Familie veröffentlicht wurde. Dieses Modell stellt eine iterative Verbesserung gegenüber früheren GPT-3.5-Versionen dar und integriert erweiterte Fähigkeiten zur Befolgung von Anweisungen sowie verbesserte Leistung bei verschiedenen Aufgaben der natürlichen Sprachverarbeitung. Es nutzt eine Transformer-basierte Architektur, die auf vielfältigen Internettext-Daten trainiert wurde, wobei OpenAI weder die exakte Parameteranzahl noch detaillierte Trainingsspezifikationen öffentlich bekannt gegeben hat. Das Modell ist für universelle Textgenerierungsanwendungen konzipiert, darunter konversationelle KI, Content-Erstellung, Zusammenfassung, Übersetzung und Frage-Antwort-Aufgaben. Es verarbeitet Texteingaben und generiert menschenähnliche Antworten basierend auf den während des Trainings erlernten Mustern. GPT-3.5 Turbo 1106 unterstützt standardmäßige textbasierte Interaktionen und kann komplexe Anweisungen verarbeiten, während es den Kontext über mehrstufige Konversationen hinweg beibehält. Das Modell zeigt Kompetenz über mehrere Domänen und Sprachen hinweg, wobei die Leistung je nach spezifischer Aufgabe und Sprache variieren kann. Innerhalb der Modellreihe von OpenAI liegt GPT-3.5 Turbo 1106 hinsichtlich Fähigkeiten und Reasoning-Leistung unter der fortschrittlicheren GPT-4-Serie. Es dient als leistungsfähige Option für Anwendungen, bei denen die zusätzliche Komplexität der GPT-4-Modelle nicht erforderlich ist. Das Modell ist über die API von OpenAI zugänglich und wurde in verschiedene Anwendungen und Dienste integriert. Diese Version löste frühere GPT-3.5 Turbo-Iterationen ab und bietet verbesserte Zuverlässigkeit sowie Function-Calling-Funktionen für Entwickler, die KI-gestützte Anwendungen erstellen.

GPT-3.5 Turbo 1106 markiert eine ausgewogene Wahl für Anwendungen, die solide Sprachverarbeitung ohne die Komplexität fortgeschrittener Modelle benötigen. Als November-2023-Release verbessert es die Instruktionsbefolgung gegenüber früheren GPT-3.5-Versionen.

Tokonomix Modellanalyse
Abschnitt 01

Qualitätswerte

Auswertungsergebnisse aus Judge-Model-Bewertungen über verschiedene Aufgabenkategorien. Werte spiegeln Kohärenz, Genauigkeit und Anweisungsbefolgung wider.

100
Codegenerierung
98
Mehrsprachig
100
Schlussfolgern
Abschnitt 02

Preisverlauf

Direkte Provider-Tarife pro Million Tokens, plus eine typische Gesprächskostenschätzung.

💰
API-Tarife — gpt-3.5-turbo-1106
$1.00 pro 1M Input-Tokens
$2.00 pro 1M Output-Tokens
≈ $0.0010 pro typischem Gespräch (800 Tokens)
Input- vs. Output-Preis (pro 1M Tokens)
pro 1M Input-Tokens$1.00
pro 1M Output-Tokens$2.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.00

input / 1M

— stable

$2.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Abschnitt 03

Stärken & Schwächen

Basierend auf Benchmark-Ergebnissen und aggregiertem Community-Feedback zu realen Anwendungsfällen.

Stärken

Verbesserte InstruktionsbefolgungMehrsprachige KonversationsfähigkeitKontexterhaltung über mehrere TurnsBreite DomänenkompetenzEtablierte API-IntegrationVielseitige NLP-AufgabenZuverlässige TexterzeugungMehrsprachiger Support

Schwächen

Wissenstand von 2023Begrenzte Reasoning-Fähigkeiten vs. GPT-4Nur Text, keine MultimodalitätNeuere Modelle verfügbar
Abschnitt 04

Fähigkeiten

toolssource: litellmparallel toolsprompt cachingmax output tokens: 4096
Abschnitt 05

Häufig gestellte Fragen

Die 1106-Version bietet verbesserte Instruktionsbefolgung und optimierte Performance bei verschiedenen NLP-Aufgaben. Es wurde im November 2023 veröffentlicht und repräsentiert eine iterative Verbesserung der GPT-3.5-Familie.

Für produktionsreife Anwendungen mit moderaten Anforderungen bietet dieses Modell ein bewährtes Fundament, auch wenn neuere Alternativen in spezifischen Bereichen überlegen sein können. Es bleibt eine praktikable Option für Projekte, die etablierte Stabilität priorisieren.

Tokonomix Redaktion
Abschnitt 06

Verfügbarkeit

Verfügbarkeit

Noch keine Messdaten

Es wurden noch nicht genug API-Aufrufe aufgezeichnet, um Verfügbarkeitsstatistiken für dieses Modell anzuzeigen. Daten erscheinen, sobald das Modell Live-Traffic erhält.

Abschnitt 07

Tokonomix-Benchmark-Urteile

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-581/100 · 76 runs
46 correct18 partial12 wrong61% accuracy
2026-06-14

New tool capabilities added; performance data still unavailable

The gpt-3.5-turbo-1106 model has received significant functional updates in this benchmark window, adding support for tools, parallel tool execution, and prompt caching capabilities. These additions expand the model's utility for developers building applications that require function calling and iterative workflows. However, the absence of performance data in both the current and previous benchmark windows makes it impossible to assess the model's actual execution quality, latency, or reliability characteristics. Without metrics on accuracy, response times, or comparative performance against other models in its class, users lack critical information needed for informed deployment decisions. The new capabilities represent important feature parity improvements, particularly the parallel tools functionality which can reduce latency in complex multi-step operations. Prompt caching may offer efficiency gains for applications with repetitive context. Despite these functional enhancements, the continued lack of benchmark results means the model's practical performance remains unverified through independent testing. Organizations considering this model should conduct their own evaluation testing to validate it meets their specific requirements for accuracy, speed, and cost effectiveness.

Quality

Latency p50

Test runs

0

Tool support added Parallel tools capability enabled Prompt caching now available No performance data available
Abschnitt 08

Vollständiges Modellprofil

gpt-3.5-turbo-1106 — illustration 1

⚠️ Veraltetes Modell. OpenAI hat dieses Modell außer Betrieb genommen. Für neue Projekte siehe GPT-4o mini für kosteneffiziente allgemeine Nutzung oder GPT-4.1 für stärkeres Reasoning. Bestehende Integrationen sollten die Migration planen, bevor der API-Endpunkt eingestellt wird.

gpt-3.5-turbo-1106: der Snapshot, der JSON-Modus einführte

gpt-3.5-turbo-1106 ist der datierte Snapshot von GPT-3.5 Turbo, der am 6. November 2023 veröffentlicht wurde. Es war die OpenAI-DevDay-Veröffentlichung — das Modell, das JSON-Modus, paralleles Function Calling und Reproduzierbarkeits-Seed-Parameter in die 3.5-Linie brachte.

Das Modell ist jetzt veraltet. Die gepinnte Kennung löst immer noch auf, aber neue Builds sollten auf ein aktuelles Modell abzielen.

Was in dieser Version ausgeliefert wurde

Die Veröffentlichung vom 6. November 2023 ging weniger um Verbesserungen der Modellgewichte und mehr um API-Oberflächenfunktionen. Die 3.5-Linie erreichte eine Art Reife; OpenAI nutzte diese Veröffentlichung, um die Deployment-Zeit-Kontrollen hinzuzufügen, nach denen Produktionsteams gefragt hatten.

JSON-Modus. Vor 1106 bedeutete das Erhalten von zuverlässigem JSON aus 3.5 Turbo Prompt-Engineering und einen defensiven Parser. Die 1106-Veröffentlichung fügte ein Flag hinzu, das die Generierung auf gültiges JSON beschränkte. Die Beschränkung war keine strikte Schema-Durchsetzung — das kam später —, aber sie reichte aus, um JSON-förmige Ausgaben zuverlässig zu machen, ohne Prompt-Layer-Tricks. Für Datenextraktions-Pipelines, die das ältere Verhalten umgangen hatten, war dies eine echte Vereinfachung.

Paralleles Function Calling. Die frühere Function-Calling-Unterstützung auf 3.5 war sequenziell — das Modell konnte einen Tool-Aufruf nach dem anderen anfordern, und man musste für den nächsten zurück zum Modell gehen. Die 1106-Veröffentlichung fügte die Fähigkeit hinzu, dass das Modell mehrere Tool-Aufrufe in einer einzigen Antwort anfordern konnte. Agent-Loops, die zuvor N Roundtrips für N Tool-Aufrufe benötigten, konnten auf einen einzigen kollabieren.

Reproduzierbarkeit. Der seed-Parameter landete in dieser Version. Übergebe denselben Seed und denselben Prompt, erhalte dieselbe Ausgabe meistens. Der Teil „meistens" ist wichtig — der Parameter verbesserte die Reproduzierbarkeit, ohne sie zu garantieren, weil Nicht-Determinismus im Inference-Stack immer noch durchsickerte. Aber für Evaluierungsarbeit und Debugging war der Seed nützlich genug, dass die meisten Produktionsteams begannen, ihn zu verwenden.

Was gleich blieb

Das zugrundeliegende Modellverhalten. 1106 war die 3.5-Generation unter der Haube. Reasoning-Tiefe, Faktentreue, Ablehnungs-Kalibrierung — alles ungefähr dasselbe wie bei den Snapshots unmittelbar davor. Die Veröffentlichung drehte sich um Deployment-Ergonomie, nicht darum, das Modell intelligenter zu machen.

Kontextfenster. 16.385 Token. Lang genug für den meisten Chat-Traffic, kurz genug, dass Workloads mit langen Dokumenten regelmäßig an die Grenze stießen.

Kostenprofil. Die Preisgestaltung der 3.5-Familie verankerte weiterhin das günstige Ende der OpenAI-Produktpalette.

Warum Teams auf 1106 pinnten

Für Workloads, die von den API-Funktionen abhingen, die dieser Snapshot einführte, war 1106 der richtige Pin Ende 2023 und bis ins Jahr 2024 hinein.

JSON-Modus-abhängige Pipelines. Jedes Team, das um den neuen JSON-Modus im November 2023 herum baute, wollte Reproduzierbarkeit gegen den spezifischen Snapshot, der ihn einführte. Das Verhalten unterschied sich leicht von späteren Versionen, und nachgelagerte Parser, die auf 1106 abgestimmt waren, konnten beim Bump regressieren.

Multi-Tool-Agent-Loops. Frühe Agent-Frameworks, die paralleles Function Calling nutzten, pinnten auf 1106, weil das spezifische Verhalten des Aufrufmusters — wann das Modell Aufrufe bündelte, wie es sie ordnete, welche Argumente es produzierte — empfindlich auf den Snapshot reagierte.

Reproduzierbarkeits-abhängige Evaluierung. Forschungs- und CI-Workflows, die den Seed-Parameter im November 2023 zu verwenden begannen, pinnten oft auf 1106, weil das Verhalten des Parameters neu genug war, dass das Team nicht auch den Modell-Snapshot im selben Experiment variieren wollte.

Der 0125-Snapshot, der zweieinhalb Monate später veröffentlicht wurde, war eine polierte Version desselben Feature-Sets. Der meiste Produktions-Traffic, der auf 1106 begann, migrierte innerhalb eines Quartals zu 0125.

Migrationsziele

Für JSON-Modus-abhängige Workloads ist die strikte Structured-Outputs-Funktion, die im GPT-4o-Snapshot vom August 2024 und über die GPT-4.1-Familie hinweg landete, das bessere Ziel als ein weiterer 3.5-Snapshot. Schema-Durchsetzung auf der Inference-Ebene ist materiell zuverlässiger als JSON-Modus-mit-defensivem-Parsing.

Für Agent-Loop-Workloads, die auf parallelem Function Calling aufgebaut sind, funktioniert dasselbe Aufrufmuster auf GPT-4o, GPT-4.1 und der 4.1-Mini-Variante. Das Verhaltens-Delta ist klein genug, dass die Migration normalerweise ein Tag-Swap plus eine Re-Evaluierung ist.

Für Reproduzierbarkeits-abhängige Eval-Workflows wird der Seed-Parameter über die aktuelle OpenAI-Produktpalette hinweg unterstützt. Der Wechsel von 1106 zu einem aktuellen Modell bedeutet, die geseedeten Eval-Ausgaben gegen das neue Modell neu zu basieren; der Parameter selbst ändert sich nicht.

Was heute zu tun ist

Wenn 1106 immer noch in Ihrem Stack gepinnt ist, spiegeln die Aktionspunkte den Rest der 3.5-Familie wider. Prüfen Sie den Workload, um zu bestätigen, dass der Pin sich immer noch lohnt. Führen Sie eine gemessene Evaluierung gegen das Kandidaten-Migrationsziel durch. Planen Sie den Übergang für ein Release-Fenster Ihrer Wahl und nicht unter Deprecation-Druck.

Der spezifische 1106-Fall, auf den man achten sollte, ist nachgelagerter Code, der vom frühen Parallel-Function-Calling-Verhalten abhängt. Einige Agent-Frameworks, die gegen diesen Snapshot gewachsen sind, haben Grenzfälle darin, wie sie Multi-Tool-Antworten parsen, die technisch gegen spätere Modelle gültig sind, aber sich verhaltenstechnisch unterscheiden. Testen Sie die Loops erneut, nicht nur das Modell.

Für den kategorieübergreifenden Vergleich siehe /benchmarks/leaderboard. Für den Kontext des schwebenden 3.5-Tags siehe GPT-3.5 Turbo.

Auswahl dieses Modells

Wählen Sie diesen Snapshot nicht für neue Builds. Die 3.5-Familie ist veraltet.

Für bestehende 1106-Integrationen sind die natürlichen Nachfolger GPT-4o mini für allgemeinen Chat-Traffic und GPT-4.1 mini oder volles GPT-4.1 für Workloads, bei denen die Reasoning-Obergrenze der 3.5-Generation bereits eine Einschränkung war. Planen Sie die Migration, bevor das Deprecation-Datum eintrifft.

Letzte technische Überprüfung: 2026-05-22 — Tokonomix.ai

gpt-3.5-turbo-1106 — illustration 2gpt-3.5-turbo-1106 — illustration 3
Letzter automatisierter Test
14. Juni 2026 · 04:56 UTC · Benchmark
P50-Latenz
1328 ms
P95-Latenz
Fehler
0 / 6 Läufe
Zuletzt geprüft von Tokonomix-Team·26. Mai 2026