Unterscheidet es sich von den Chat-Varianten?

Ja, es verwendet die ältere Instruct-Architektur statt dem ChatML-Format, was es für Single-Turn-Anfragen interessant macht.

Wird dieses Modell weiterentwickelt?

Der 0914-Snapshot ist eingefroren und erhält keine weiteren Updates.

Eignet es sich für neue Projekte?

Es läuft stabil über die API, eignet sich aber eher für Legacy-Integrationen als für neue Projekte.

Läuft in:USErstellt in:United States

Archiviert

Dieses Modell wurde vom Anbieter eingestellt. Historische Daten bleiben erhalten.

Seit 27. Mai 2026 nicht mehr verfügbar.

OpenAI

gpt-3.5-turbo-instruct-0914

Tokonomix-Redaktionsteam·Geprüft von Mes Kalkan·Veröffentlicht 5. Mai 2026·Zuletzt geprüft 26. Mai 2026

GPT-3.5-turbo-instruct-0914 ist ein Textvervollständigungsmodell von OpenAI, das im September 2023 veröffentlicht wurde. Im Gegensatz zu den chat-orientierten GPT-3.5-turbo-Varianten verwendet dieses Modell die ältere Instruct-Following-Architektur, die ursprünglich mit GPT-3 eingeführt wurde, wodurch es sich besser für Single-Turn-Vervollständigungsaufgaben als für Multi-Turn-Konversationen eignet. Es ist für Anwendungen konzipiert, die direkte Textfortsetzung, Klassifizierung, Transformation und andere traditionelle Sprachmodelloperationen ohne den Overhead konversationeller Formatierung erfordern. Das Modell verarbeitet Standard-Textgenerierungsanfragen und folgt Anweisungen, die in Prompts eingebettet sind. Es stellt eine Fortsetzung von OpenAIs InstructGPT-Linie dar, die Reinforcement Learning from Human Feedback (RLHF) anwendet, um die Fähigkeit zur Befolgung von Anweisungen zu verbessern. Die Bezeichnung „0914" gibt das spezifische Snapshot-Datum vom 14. September 2023 an. Während die Größe des Kontextfensters von OpenAI nicht öffentlich bekannt gegeben wurde, wird erwartet, dass es typische Vervollständigungsaufgaben innerhalb standardmäßiger Längenbeschränkungen bewältigt. Innerhalb von OpenAIs Modellpalette nimmt gpt-3.5-turbo-instruct-0914 eine spezialisierte Position neben den häufiger verwendeten chat-optimierten GPT-3.5- und GPT-4-Varianten ein. Es dient Nutzern, die speziell Completion-Style-Outputs anstelle von konversationellen Antworten benötigen, was es besonders relevant für Legacy-Anwendungen, bestimmte API-Integrationen und Anwendungsfälle macht, bei denen das Completion-Paradigma direktere Kontrolle über die Output-Formatierung bietet. Das Modell bietet ein alternatives Schnittstellenmuster für Entwickler, die den traditionellen Completion-Ansatz gegenüber chat-basierten Interaktionen bevorzugen oder benötigen.

Ein Klassiker der Sprachverarbeitung, der den Completion-Ansatz konsequent lebt – ohne Chat-Ballast.
— Tokonomix-Benchmark-Zusammenfassung

Abschnitt 01

Preisverlauf

Direkte Provider-Tarife pro Million Tokens, plus eine typische Gesprächskostenschätzung.

💰

API-Tarife — gpt-3.5-turbo-instruct-0914

$1.50 pro 1M Input-Tokens

$2.00 pro 1M Output-Tokens

≈ $0.0013 pro typischem Gespräch (800 Tokens)

Input- vs. Output-Preis (pro 1M Tokens)

pro 1M Input-Tokens$1.50

pro 1M Output-Tokens$2.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.50

input / 1M

— no change

$2.00

output / 1M

— no change

2026-05-242026-05-242026-05-24

Input

Output

Price change

⟳ synced weekly

Abschnitt 02

Stärken & Schwächen

Basierend auf Benchmark-Ergebnissen und aggregiertem Community-Feedback zu realen Anwendungsfällen.

Stärken

Niedrige Latenz bei Completion-AufgabenPräzises Instruction-FollowingKlassische InstructGPT-ArchitekturSingle-Turn-OptimiertRLHF-verfeinertes VerhaltenStabiler September-2023-Snapshot

Schwächen

Kein Multi-Turn-Dialog möglichVeralteter WissensstandBegrenzte Kontextlänge

Abschnitt 03

Häufig gestellte Fragen

Es ist für klassische Textvervollständigung konzipiert – Klassifikation, Transformation und direkte Ausgaben ohne Gesprächsformat.

Für Entwickler, die direkte Textvervollständigung statt Gesprächs-Overhead brauchen, bleibt dieses Modell eine solide Referenz.
— Tokonomix-Benchmark-Zusammenfassung

Abschnitt 04

Verfügbarkeit

Noch keine Messdaten

Es wurden noch nicht genug API-Aufrufe aufgezeichnet, um Verfügbarkeitsstatistiken für dieses Modell anzuzeigen. Daten erscheinen, sobald das Modell Live-Traffic erhält.

Abschnitt 05

Tokonomix-Benchmark-Urteile

● 2026-05-24

Baseline für GPT-3.5 Turbo Instruct Instruction-Following-Modell etabliert

Dies ist die erste Benchmark-Auswertung für gpt-3.5-turbo-instruct-0914 und legt damit Basiswerte für künftige Vergleiche fest. Als instruktionsorientierte Variante von GPT-3.5 Turbo, die auf Single-Turn-Completion-Aufgaben statt auf Chat ausgerichtet ist, bedient dieses Modell einen eigenständigen Anwendungsfall im Modellportfolio von OpenAI. Da keine Vergleichsdaten vorliegen, konzentriert sich dieses Urteil darauf, das anfängliche Leistungsprofil zu erfassen. Nutzer sollten beachten, dass sich dieses Modell in seiner Designphilosophie vom Standard-GPT-3.5 Turbo unterscheidet und die direkte Befolgung von Anweisungen über dialogorientierte Interaktionen stellt. Die Instruct-Variante überzeugt typischerweise bei klar umrissener Aufgabenbearbeitung, Klassifizierung und strukturierter Ausgabeerstellung, bei denen explizite Prompts vorhersehbare Ergebnisse liefern. Da es sich um einen Snapshot aus September 2014 handelt, können Nutzer mit stabilem Verhalten bei Anwendungen rechnen, die konsistente Instruction-Following-Fähigkeiten erfordern. Künftige Urteile werden Leistungsschwankungen, Fähigkeitsverbesserungen oder Verhaltensänderungen gegenüber dieser etablierten Baseline dokumentieren. Organisationen, die produktive Anwendungen entwickeln, sollten nachfolgende Benchmarks beobachten, um die Entwicklung dieses Modells im Verhältnis zu diesen ersten Messwerten einzuordnen.

Quality

—

Latency p50

—

Test runs

✓ Basismetriken festgelegt✓ Optimierung der Anweisungsbefolgung bestätigt

Abschnitt 06

Vollständiges Modellprofil

⚠️ Veraltetes Modell. OpenAI hat dieses Modell eingestellt. Für neue Projekte siehe GPT-4o mini für kosteneffiziente allgemeine Anwendungen oder GPT-4.1 für stärkeres Reasoning. Bestehende Integrationen sollten die Migration planen, bevor der API-Endpunkt abgeschaltet wird.

gpt-3.5-turbo-instruct-0914: der gepinnte Instruct-Snapshot

gpt-3.5-turbo-instruct-0914 ist der datierte Snapshot der Instruct-Variante von OpenAIs GPT-3.5 Turbo, eingefroren auf dem Release vom 14. September 2023. Es ist der gepinnte Identifier für die Variante, die 3.5 über die Legacy-Completions-API anstelle des Chat-Interfaces bereitstellte.

Das Modell ist veraltet. Auch die Completions-API-Oberfläche selbst läuft über das gesamte OpenAI-Portfolio hinweg aus. Neue Projekte sollten diesen Identifier nicht ansprechen.

Warum genau dieses Datum relevant ist

Das Release vom September 2023 ist der Snapshot, auf den die meisten Produktionsteams am Ende pinnten, wenn sie Reproduzierbarkeit gegenüber der Instruct-Variante brauchten. Das Release lag vor den größeren Änderungen der 3.5-Familie, die mit dem DevDay-Update im November 2023 kamen — kein JSON-Modus, kein paralleles Function Calling, nichts davon. Was es hatte, war ein stabiles, gut verstandenes Modell, gegen das die erste Generation LLM-gestützter Produkte gebaut worden war.

Für Teams, die Evaluierungen eingereicht oder Lieferantenverträge mit Bezug auf die Instruct-Variante geschrieben haben, ist dieser Snapshot häufig derjenige, der namentlich genannt wird. Für Forschungs-Workflows, die Reproduzierbarkeit gegenüber dem in einem bestimmten Paper oder Benchmark aus Ende 2023 verwendeten Modell brauchten, ist dies häufig der Identifier.

Der größere Zusammenhang: Die Instruct-Variante existierte genau dazu, um Code, der gegen die ältere Completions-API geschrieben war, einen Pfad nach vorn zu geben, ohne eine Re-Architektur auf das Chat-Interface zu erzwingen. Sich auf einen bestimmten Snapshot dieser Variante festzulegen, ist doppelt konservativ — sowohl die API-Oberfläche als auch das Modellverhalten sind zeitlich eingefroren.

Was in diesem Snapshot ausgeliefert wird

Die Instruct-Variante von GPT-3.5 Turbo im Stand vom September 2023. Kontextfenster mit 16.385 Token. Single-String-Prompt-Eingabe über die Legacy-Completions-API, Single-String-Completion-Ausgabe. Logprobs direkt über die API verfügbar. Keine Chat-Formatierung, kein rollenbasiertes Prompting, keine der Chat-trainierten Antwortmuster.

Nicht in diesem Snapshot enthalten ist alles, was in späteren 3.5-Releases gelandet ist. Kein JSON-Modus. Kein paralleles Function Calling. Kein Seed-Parameter für Reproduzierbarkeit — was leicht ironisch ist, da dies der Snapshot ist, der zu Reproduzierbarkeitszwecken gepinnt wird; man bekommt Stabilität auf Ebene der Modellgewichte, aber ohne das Reproduzierbarkeits-Tooling auf API-Ebene.

Das Modellverhalten ist auf 3.5-Generationsniveau. Reasoning-Tiefe auf diesem Niveau. Faktizität, die auf faktischen Pfaden Retrieval oder Review brauchte. Refusal-Kalibrierung, die weniger konsistent war als das, was später kam.

Warum Teams immer noch darauf pinnen

In Audits zeigen sich drei Gründe.

Erstens: Abhängigkeiten in nachgelagertem Code von den Logprobs dieses Snapshots. Klassifikationspipelines, Systeme mit Constrained Decoding und Arbeiten mit strukturiertem Sampling, die rund um die spezifischen Logprob-Verteilungen des September-Snapshots gebaut wurden, können beim Wechsel regressieren. Das Modellverhalten späterer Snapshots ist ähnlich, aber die Wahrscheinlichkeitsverteilungen sind nicht identisch, und nachgelagerte Pipelines, die eng genug abgestimmt sind, um den Unterschied zu spüren, kleben fest.

Zweitens: Regulierte Workflows, die genau diesen Identifier freigegeben haben. Einige Compliance-Reviews aus Ende 2023 nannten den September-Snapshot ausdrücklich, und der Re-Approval-Zyklus ist langsam genug, dass der Pin nicht bewegt wurde.

Drittens: Reproduzierbarkeit in der Forschung. Papers und interne Evaluierungen aus Ende 2023, die die Instruct-Variante verwendet haben, beziehen sich häufig auf diesen Snapshot, ob sie es explizit sagen oder nicht. Der Pin sorgt dafür, dass diese Ergebnisse reproduzierbar bleiben.

Was der Deprecation-Kalender bedeutet

Dies ist einer der älteren, noch auflösbaren Snapshots im OpenAI-Portfolio. Deprecation-Horizonte für datierte Snapshots liegen unter OpenAIs üblichem Zeitplan bei zwölf bis achtzehn Monaten. September 2023 liegt deutlich jenseits des frühen Endes dieses Fensters. Dass der Endpunkt heute noch antwortet, ist keine Garantie, dass er morgen antworten wird.

Die Dringlichkeit der Migration ist real. Planen Sie sie aktiv. Setzen Sie sich eine Kalendererinnerung. Beachten Sie: Das Migrationsziel ist nicht ein weiterer Instruct-Snapshot — die Completions-API-Oberfläche läuft aus, daher ist das Migrationsziel das Chat-Interface auf einem aktuellen Modell, mit der architektonischen Arbeit, die das impliziert.

Migration

Dasselbe Muster, das für die breitere Instruct-Variante gilt, gilt auch hier, mit der zusätzlichen Einschränkung, dass Sie von einem eingefrorenen Snapshot statt vom Floating Tag migrieren.

Für Workloads, die auf Logprob-Verteilungen gepinnt sind, prüfen Sie, ob die nachgelagerte Arbeit auf das strikte Structured-Outputs-Feature aktueller OpenAI-Modelle umziehen kann. Schema-Durchsetzung auf der Inferenzebene ist häufig ein saubererer Ersatz für logprob-bewusstes Sampling, als einem Nachfolge-Instruct-Modell hinterherzulaufen, das nicht existiert.

Für compliance-gepinnte Workloads ist der Re-Approval-Zyklus Teil der Migrationskosten. Beginnen Sie das Gespräch mit den Prüfern, bevor das Deprecation-Datum angekündigt wird; es unter Zeitdruck zu tun, ist teurer.

Für auf Forschungs-Reproduzierbarkeit gepinnte Workloads lautet die praktische Antwort: Veröffentlichen Sie Baseline-Zahlen gegen ein aktuelles Modell neben den historischen Zahlen und überführen Sie dann die Produktionspipeline. Die historischen Ergebnisse bleiben gegenüber archivierten Snapshots und aufgezeichneten Ausgaben reproduzierbar; das Live-System läuft gegen aktuelle Gewichte.

Für den Floating-Instruct-Kontext siehe gpt-3.5-turbo-instruct. Für das aktuelle OpenAI-Portfolio siehe GPT-4.1 und GPT-4o mini.

Was heute zu tun ist

Wenn dieser Identifier noch in Ihrem Code steckt, sind die Schritte konkret.

Erstens: Finden Sie die Aufrufstelle und dokumentieren Sie, warum der Pin existiert. Die oben genannten Gründe sind die häufigen; der Grund Ihres Teams kann spezifischer sein.

Zweitens: Führen Sie eine echte Evaluierung gegen Ihr Kandidaten-Migrationsziel durch. Neuere Modelle und das Chat-Interface brauchen anderes Prompting; das Übertragen der Instruct-Ära-Muster kann einen Nachfolger schlechter aussehen lassen, als er ist.

Drittens: Planen Sie die Umstellung für ein Release-Fenster Ihrer Wahl, nicht unter Deprecation-Druck. Der September-2023-Snapshot liegt am älteren Ende des OpenAI-Portfolios. Das Deprecation-Datum ist näher als das Release-Datum.

Auswahl

Wählen Sie diesen Snapshot nicht für neue Builds. Er ist veraltet, und die API-Oberfläche selbst läuft aus.

Für bestehende Integrationen ist das Migrationsziel ein aktuelles Chat-Interface-Modell — GPT-4o mini für chat-geformten Traffic, GPT-4.1 oder GPT-4.1 mini für Workloads, bei denen die 3.5-Reasoning-Obergrenze ohnehin schon eine Einschränkung war. Planen Sie bewusst.

Letzte technische Prüfung: 2026-05-22 — Tokonomix.ai

Letzter automatisierter Test

27. Mai 2026 · 21:57 UTC · Benchmark

P50-Latenz

—

P95-Latenz

—

Fehler

1 / 6 Läufe

Zuletzt geprüft von Tokonomix-Team·26. Mai 2026