Wann sollte ich GPT-3.5 Turbo 1106 anstelle von GPT-4 verwenden?

Dieses Modell eignet sich für Anwendungen, bei denen die erweiterten Reasoning-Fähigkeiten von GPT-4 nicht erforderlich sind. Es bietet solide Performance für Standard-Konversations-AI, Content-Erstellung und Zusammenfassungen.

Unterstützt das Modell Bild- oder Audio-Verarbeitung?

Nein, GPT-3.5 Turbo 1106 ist ausschließlich textbasiert. Für multimodale Anwendungen sind andere Modelle aus dem OpenAI-Portfolio erforderlich.

Wie aktuell ist das Trainingswissen dieses Modells?

Das Modell wurde auf Internetdaten bis zu einem bestimmten Cutoff trainiert, der vor dem Release-Datum im November 2023 liegt. Für aktuelle Ereignisse nach diesem Zeitpunkt verfügt es über kein natives Wissen.

Ist dieses Modell noch für neue Projekte empfehlenswert?

Während neuere Modellversionen verfügbar sind, bleibt GPT-3.5 Turbo 1106 eine stabile und erprobte Option. Die Wahl hängt von spezifischen Anforderungen, Budget und der Notwendigkeit neuester Features ab.

Tier C — Spezialist

Läuft in:USErstellt in:United States

OpenAI

gpt-3.5-turbo-1106

Tier C — Spezialist

Tokonomix-Redaktionsteam·Geprüft von Mes Kalkan·Veröffentlicht 22. Mai 2026·Zuletzt geprüft 26. Mai 2026

GPT-3.5 Turbo 1106 ist ein großes Sprachmodell, das von OpenAI entwickelt wurde und im November 2023 als Teil der GPT-3.5-Familie veröffentlicht wurde. Dieses Modell stellt eine iterative Verbesserung gegenüber früheren GPT-3.5-Versionen dar und integriert erweiterte Fähigkeiten zur Befolgung von Anweisungen sowie verbesserte Leistung bei verschiedenen Aufgaben der natürlichen Sprachverarbeitung. Es nutzt eine Transformer-basierte Architektur, die auf vielfältigen Internettext-Daten trainiert wurde, wobei OpenAI weder die exakte Parameteranzahl noch detaillierte Trainingsspezifikationen öffentlich bekannt gegeben hat. Das Modell ist für universelle Textgenerierungsanwendungen konzipiert, darunter konversationelle KI, Content-Erstellung, Zusammenfassung, Übersetzung und Frage-Antwort-Aufgaben. Es verarbeitet Texteingaben und generiert menschenähnliche Antworten basierend auf den während des Trainings erlernten Mustern. GPT-3.5 Turbo 1106 unterstützt standardmäßige textbasierte Interaktionen und kann komplexe Anweisungen verarbeiten, während es den Kontext über mehrstufige Konversationen hinweg beibehält. Das Modell zeigt Kompetenz über mehrere Domänen und Sprachen hinweg, wobei die Leistung je nach spezifischer Aufgabe und Sprache variieren kann. Innerhalb der Modellreihe von OpenAI liegt GPT-3.5 Turbo 1106 hinsichtlich Fähigkeiten und Reasoning-Leistung unter der fortschrittlicheren GPT-4-Serie. Es dient als leistungsfähige Option für Anwendungen, bei denen die zusätzliche Komplexität der GPT-4-Modelle nicht erforderlich ist. Das Modell ist über die API von OpenAI zugänglich und wurde in verschiedene Anwendungen und Dienste integriert. Diese Version löste frühere GPT-3.5 Turbo-Iterationen ab und bietet verbesserte Zuverlässigkeit sowie Function-Calling-Funktionen für Entwickler, die KI-gestützte Anwendungen erstellen.

GPT-3.5 Turbo 1106 markiert eine ausgewogene Wahl für Anwendungen, die solide Sprachverarbeitung ohne die Komplexität fortgeschrittener Modelle benötigen. Als November-2023-Release verbessert es die Instruktionsbefolgung gegenüber früheren GPT-3.5-Versionen.
— Tokonomix Modellanalyse

Abschnitt 01

Qualitätswerte

Auswertungsergebnisse aus Judge-Model-Bewertungen über verschiedene Aufgabenkategorien. Werte spiegeln Kohärenz, Genauigkeit und Anweisungsbefolgung wider.

Kreativ

Faktisch

100

Mehrsprachig

Schlussfolgern

Abschnitt 02

Preisverlauf

Direkte Provider-Tarife pro Million Tokens, plus eine typische Gesprächskostenschätzung.

💰

API-Tarife — gpt-3.5-turbo-1106

$1.00 pro 1M Input-Tokens

$2.00 pro 1M Output-Tokens

≈ $0.0010 pro typischem Gespräch (800 Tokens)

Input- vs. Output-Preis (pro 1M Tokens)

pro 1M Input-Tokens$1.00

pro 1M Output-Tokens$2.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.00

input / 1M

— stable

$2.00

output / 1M

— stable

2026-05-242026-06-282026-07-26

Input

Output

Price change

⟳ synced weekly

Abschnitt 03

Stärken & Schwächen

Basierend auf Benchmark-Ergebnissen und aggregiertem Community-Feedback zu realen Anwendungsfällen.

Stärken

Verbesserte InstruktionsbefolgungMehrsprachige KonversationsfähigkeitKontexterhaltung über mehrere TurnsBreite DomänenkompetenzEtablierte API-IntegrationVielseitige NLP-AufgabenZuverlässige TexterzeugungMehrsprachiger Support

Schwächen

Wissenstand von 2023Begrenzte Reasoning-Fähigkeiten vs. GPT-4Nur Text, keine MultimodalitätNeuere Modelle verfügbar

Abschnitt 04

Fähigkeiten

toolssource: litellmparallel toolsprompt cachingmax output tokens: 4096

Abschnitt 05

Häufig gestellte Fragen

Die 1106-Version bietet verbesserte Instruktionsbefolgung und optimierte Performance bei verschiedenen NLP-Aufgaben. Es wurde im November 2023 veröffentlicht und repräsentiert eine iterative Verbesserung der GPT-3.5-Familie.

Für produktionsreife Anwendungen mit moderaten Anforderungen bietet dieses Modell ein bewährtes Fundament, auch wenn neuere Alternativen in spezifischen Bereichen überlegen sein können. Es bleibt eine praktikable Option für Projekte, die etablierte Stabilität priorisieren.
— Tokonomix Redaktion

Abschnitt 06

Verfügbarkeit

Noch keine Messdaten

Es wurden noch nicht genug API-Aufrufe aufgezeichnet, um Verfügbarkeitsstatistiken für dieses Modell anzuzeigen. Daten erscheinen, sobald das Modell Live-Traffic erhält.

Abschnitt 07

Tokonomix-Benchmark-Urteile

⚖️

Endorsed by 2 judges

Independent LLM judges evaluated this model on our weekly intelligence tests

cohere/command-a100/100 · 1 runs

1 correct0 partial0 wrong100% accuracy

claude-sonnet-4-584/100 · 111 runs

76 correct18 partial17 wrong68% accuracy

● 2026-07-26

Tool calling capabilities added; no performance data available

GPT-3.5-turbo-1106 has gained several new capabilities since the previous benchmark window, most notably the addition of tools, parallel_tools, and prompt_caching features. These additions represent meaningful functional enhancements that expand the model's utility for developers building applications that require function calling and structured interactions. The parallel tools capability in particular allows for more efficient multi-step workflows. However, the absence of performance metrics in both the current and previous benchmark windows makes it impossible to assess how these new features impact the model's actual task performance, response quality, latency, or throughput. Without concrete benchmark data on accuracy, reasoning ability, or speed, users cannot determine whether this version represents an improvement, regression, or lateral move in core model performance compared to earlier iterations. The model continues to serve as OpenAI's faster, more cost-effective option in the GPT-3.5 family, but potential users should be aware that the lack of standardized benchmark results limits the ability to make informed comparisons with competing models or to validate fitness for specific use cases.

Quality

—

Latency p50

—

Test runs

✓ Tool calling support added✓ Parallel tools capability enabled✓ Prompt caching now available✗ No performance metrics available

Abschnitt 08

Vollständiges Modellprofil

⚠️ Veraltetes Modell. OpenAI hat dieses Modell außer Betrieb genommen. Für neue Projekte siehe GPT-4o mini für kosteneffiziente allgemeine Nutzung oder GPT-4.1 für stärkeres Reasoning. Bestehende Integrationen sollten die Migration planen, bevor der API-Endpunkt eingestellt wird.

gpt-3.5-turbo-1106: der Snapshot, der JSON-Modus einführte

gpt-3.5-turbo-1106 ist der datierte Snapshot von GPT-3.5 Turbo, der am 6. November 2023 veröffentlicht wurde. Es war die OpenAI-DevDay-Veröffentlichung — das Modell, das JSON-Modus, paralleles Function Calling und Reproduzierbarkeits-Seed-Parameter in die 3.5-Linie brachte.

Das Modell ist jetzt veraltet. Die gepinnte Kennung löst immer noch auf, aber neue Builds sollten auf ein aktuelles Modell abzielen.

Was in dieser Version ausgeliefert wurde

Die Veröffentlichung vom 6. November 2023 ging weniger um Verbesserungen der Modellgewichte und mehr um API-Oberflächenfunktionen. Die 3.5-Linie erreichte eine Art Reife; OpenAI nutzte diese Veröffentlichung, um die Deployment-Zeit-Kontrollen hinzuzufügen, nach denen Produktionsteams gefragt hatten.

JSON-Modus. Vor 1106 bedeutete das Erhalten von zuverlässigem JSON aus 3.5 Turbo Prompt-Engineering und einen defensiven Parser. Die 1106-Veröffentlichung fügte ein Flag hinzu, das die Generierung auf gültiges JSON beschränkte. Die Beschränkung war keine strikte Schema-Durchsetzung — das kam später —, aber sie reichte aus, um JSON-förmige Ausgaben zuverlässig zu machen, ohne Prompt-Layer-Tricks. Für Datenextraktions-Pipelines, die das ältere Verhalten umgangen hatten, war dies eine echte Vereinfachung.

Paralleles Function Calling. Die frühere Function-Calling-Unterstützung auf 3.5 war sequenziell — das Modell konnte einen Tool-Aufruf nach dem anderen anfordern, und man musste für den nächsten zurück zum Modell gehen. Die 1106-Veröffentlichung fügte die Fähigkeit hinzu, dass das Modell mehrere Tool-Aufrufe in einer einzigen Antwort anfordern konnte. Agent-Loops, die zuvor N Roundtrips für N Tool-Aufrufe benötigten, konnten auf einen einzigen kollabieren.

Reproduzierbarkeit. Der seed-Parameter landete in dieser Version. Übergebe denselben Seed und denselben Prompt, erhalte dieselbe Ausgabe meistens. Der Teil „meistens" ist wichtig — der Parameter verbesserte die Reproduzierbarkeit, ohne sie zu garantieren, weil Nicht-Determinismus im Inference-Stack immer noch durchsickerte. Aber für Evaluierungsarbeit und Debugging war der Seed nützlich genug, dass die meisten Produktionsteams begannen, ihn zu verwenden.

Was gleich blieb

Das zugrundeliegende Modellverhalten. 1106 war die 3.5-Generation unter der Haube. Reasoning-Tiefe, Faktentreue, Ablehnungs-Kalibrierung — alles ungefähr dasselbe wie bei den Snapshots unmittelbar davor. Die Veröffentlichung drehte sich um Deployment-Ergonomie, nicht darum, das Modell intelligenter zu machen.

Kontextfenster. 16.385 Token. Lang genug für den meisten Chat-Traffic, kurz genug, dass Workloads mit langen Dokumenten regelmäßig an die Grenze stießen.

Kostenprofil. Die Preisgestaltung der 3.5-Familie verankerte weiterhin das günstige Ende der OpenAI-Produktpalette.

Warum Teams auf 1106 pinnten

Für Workloads, die von den API-Funktionen abhingen, die dieser Snapshot einführte, war 1106 der richtige Pin Ende 2023 und bis ins Jahr 2024 hinein.

JSON-Modus-abhängige Pipelines. Jedes Team, das um den neuen JSON-Modus im November 2023 herum baute, wollte Reproduzierbarkeit gegen den spezifischen Snapshot, der ihn einführte. Das Verhalten unterschied sich leicht von späteren Versionen, und nachgelagerte Parser, die auf 1106 abgestimmt waren, konnten beim Bump regressieren.

Multi-Tool-Agent-Loops. Frühe Agent-Frameworks, die paralleles Function Calling nutzten, pinnten auf 1106, weil das spezifische Verhalten des Aufrufmusters — wann das Modell Aufrufe bündelte, wie es sie ordnete, welche Argumente es produzierte — empfindlich auf den Snapshot reagierte.

Reproduzierbarkeits-abhängige Evaluierung. Forschungs- und CI-Workflows, die den Seed-Parameter im November 2023 zu verwenden begannen, pinnten oft auf 1106, weil das Verhalten des Parameters neu genug war, dass das Team nicht auch den Modell-Snapshot im selben Experiment variieren wollte.

Der 0125-Snapshot, der zweieinhalb Monate später veröffentlicht wurde, war eine polierte Version desselben Feature-Sets. Der meiste Produktions-Traffic, der auf 1106 begann, migrierte innerhalb eines Quartals zu 0125.

Migrationsziele

Für JSON-Modus-abhängige Workloads ist die strikte Structured-Outputs-Funktion, die im GPT-4o-Snapshot vom August 2024 und über die GPT-4.1-Familie hinweg landete, das bessere Ziel als ein weiterer 3.5-Snapshot. Schema-Durchsetzung auf der Inference-Ebene ist materiell zuverlässiger als JSON-Modus-mit-defensivem-Parsing.

Für Agent-Loop-Workloads, die auf parallelem Function Calling aufgebaut sind, funktioniert dasselbe Aufrufmuster auf GPT-4o, GPT-4.1 und der 4.1-Mini-Variante. Das Verhaltens-Delta ist klein genug, dass die Migration normalerweise ein Tag-Swap plus eine Re-Evaluierung ist.

Für Reproduzierbarkeits-abhängige Eval-Workflows wird der Seed-Parameter über die aktuelle OpenAI-Produktpalette hinweg unterstützt. Der Wechsel von 1106 zu einem aktuellen Modell bedeutet, die geseedeten Eval-Ausgaben gegen das neue Modell neu zu basieren; der Parameter selbst ändert sich nicht.

Was heute zu tun ist

Wenn 1106 immer noch in Ihrem Stack gepinnt ist, spiegeln die Aktionspunkte den Rest der 3.5-Familie wider. Prüfen Sie den Workload, um zu bestätigen, dass der Pin sich immer noch lohnt. Führen Sie eine gemessene Evaluierung gegen das Kandidaten-Migrationsziel durch. Planen Sie den Übergang für ein Release-Fenster Ihrer Wahl und nicht unter Deprecation-Druck.

Der spezifische 1106-Fall, auf den man achten sollte, ist nachgelagerter Code, der vom frühen Parallel-Function-Calling-Verhalten abhängt. Einige Agent-Frameworks, die gegen diesen Snapshot gewachsen sind, haben Grenzfälle darin, wie sie Multi-Tool-Antworten parsen, die technisch gegen spätere Modelle gültig sind, aber sich verhaltenstechnisch unterscheiden. Testen Sie die Loops erneut, nicht nur das Modell.

Für den kategorieübergreifenden Vergleich siehe /benchmarks/leaderboard. Für den Kontext des schwebenden 3.5-Tags siehe GPT-3.5 Turbo.

Auswahl dieses Modells

Wählen Sie diesen Snapshot nicht für neue Builds. Die 3.5-Familie ist veraltet.

Für bestehende 1106-Integrationen sind die natürlichen Nachfolger GPT-4o mini für allgemeinen Chat-Traffic und GPT-4.1 mini oder volles GPT-4.1 für Workloads, bei denen die Reasoning-Obergrenze der 3.5-Generation bereits eine Einschränkung war. Planen Sie die Migration, bevor das Deprecation-Datum eintrifft.

Letzte technische Überprüfung: 2026-05-22 — Tokonomix.ai

Letzter automatisierter Test

26. Juli 2026 · 05:30 UTC · Benchmark

P50-Latenz

1249 ms

P95-Latenz

—

Fehler

0 / 6 Läufe

Zuletzt geprüft von Tokonomix-Team·26. Mai 2026