
gpt-3.5-turbo-instruct-0914: der gepinnte Instruct-Snapshot⚠️ Veraltetes Modell. OpenAI hat dieses Modell eingestellt. Für neue Projekte siehe GPT-4o mini für kosteneffiziente allgemeine Anwendungen oder GPT-4.1 für stärkeres Reasoning. Bestehende Integrationen sollten die Migration planen, bevor der API-Endpunkt abgeschaltet wird.
gpt-3.5-turbo-instruct-0914 ist der datierte Snapshot der Instruct-Variante von OpenAIs GPT-3.5 Turbo, eingefroren auf dem Release vom 14. September 2023. Es ist der gepinnte Identifier für die Variante, die 3.5 über die Legacy-Completions-API anstelle des Chat-Interfaces bereitstellte.
Das Modell ist veraltet. Auch die Completions-API-Oberfläche selbst läuft über das gesamte OpenAI-Portfolio hinweg aus. Neue Projekte sollten diesen Identifier nicht ansprechen.
Warum genau dieses Datum relevant ist
Das Release vom September 2023 ist der Snapshot, auf den die meisten Produktionsteams am Ende pinnten, wenn sie Reproduzierbarkeit gegenüber der Instruct-Variante brauchten. Das Release lag vor den größeren Änderungen der 3.5-Familie, die mit dem DevDay-Update im November 2023 kamen — kein JSON-Modus, kein paralleles Function Calling, nichts davon. Was es hatte, war ein stabiles, gut verstandenes Modell, gegen das die erste Generation LLM-gestützter Produkte gebaut worden war.
Für Teams, die Evaluierungen eingereicht oder Lieferantenverträge mit Bezug auf die Instruct-Variante geschrieben haben, ist dieser Snapshot häufig derjenige, der namentlich genannt wird. Für Forschungs-Workflows, die Reproduzierbarkeit gegenüber dem in einem bestimmten Paper oder Benchmark aus Ende 2023 verwendeten Modell brauchten, ist dies häufig der Identifier.
Der größere Zusammenhang: Die Instruct-Variante existierte genau dazu, um Code, der gegen die ältere Completions-API geschrieben war, einen Pfad nach vorn zu geben, ohne eine Re-Architektur auf das Chat-Interface zu erzwingen. Sich auf einen bestimmten Snapshot dieser Variante festzulegen, ist doppelt konservativ — sowohl die API-Oberfläche als auch das Modellverhalten sind zeitlich eingefroren.
Was in diesem Snapshot ausgeliefert wird
Die Instruct-Variante von GPT-3.5 Turbo im Stand vom September 2023. Kontextfenster mit 16.385 Token. Single-String-Prompt-Eingabe über die Legacy-Completions-API, Single-String-Completion-Ausgabe. Logprobs direkt über die API verfügbar. Keine Chat-Formatierung, kein rollenbasiertes Prompting, keine der Chat-trainierten Antwortmuster.
Nicht in diesem Snapshot enthalten ist alles, was in späteren 3.5-Releases gelandet ist. Kein JSON-Modus. Kein paralleles Function Calling. Kein Seed-Parameter für Reproduzierbarkeit — was leicht ironisch ist, da dies der Snapshot ist, der zu Reproduzierbarkeitszwecken gepinnt wird; man bekommt Stabilität auf Ebene der Modellgewichte, aber ohne das Reproduzierbarkeits-Tooling auf API-Ebene.
Das Modellverhalten ist auf 3.5-Generationsniveau. Reasoning-Tiefe auf diesem Niveau. Faktizität, die auf faktischen Pfaden Retrieval oder Review brauchte. Refusal-Kalibrierung, die weniger konsistent war als das, was später kam.
Warum Teams immer noch darauf pinnen
In Audits zeigen sich drei Gründe.
Erstens: Abhängigkeiten in nachgelagertem Code von den Logprobs dieses Snapshots. Klassifikationspipelines, Systeme mit Constrained Decoding und Arbeiten mit strukturiertem Sampling, die rund um die spezifischen Logprob-Verteilungen des September-Snapshots gebaut wurden, können beim Wechsel regressieren. Das Modellverhalten späterer Snapshots ist ähnlich, aber die Wahrscheinlichkeitsverteilungen sind nicht identisch, und nachgelagerte Pipelines, die eng genug abgestimmt sind, um den Unterschied zu spüren, kleben fest.
Zweitens: Regulierte Workflows, die genau diesen Identifier freigegeben haben. Einige Compliance-Reviews aus Ende 2023 nannten den September-Snapshot ausdrücklich, und der Re-Approval-Zyklus ist langsam genug, dass der Pin nicht bewegt wurde.
Drittens: Reproduzierbarkeit in der Forschung. Papers und interne Evaluierungen aus Ende 2023, die die Instruct-Variante verwendet haben, beziehen sich häufig auf diesen Snapshot, ob sie es explizit sagen oder nicht. Der Pin sorgt dafür, dass diese Ergebnisse reproduzierbar bleiben.
Was der Deprecation-Kalender bedeutet
Dies ist einer der älteren, noch auflösbaren Snapshots im OpenAI-Portfolio. Deprecation-Horizonte für datierte Snapshots liegen unter OpenAIs üblichem Zeitplan bei zwölf bis achtzehn Monaten. September 2023 liegt deutlich jenseits des frühen Endes dieses Fensters. Dass der Endpunkt heute noch antwortet, ist keine Garantie, dass er morgen antworten wird.
Die Dringlichkeit der Migration ist real. Planen Sie sie aktiv. Setzen Sie sich eine Kalendererinnerung. Beachten Sie: Das Migrationsziel ist nicht ein weiterer Instruct-Snapshot — die Completions-API-Oberfläche läuft aus, daher ist das Migrationsziel das Chat-Interface auf einem aktuellen Modell, mit der architektonischen Arbeit, die das impliziert.
Migration
Dasselbe Muster, das für die breitere Instruct-Variante gilt, gilt auch hier, mit der zusätzlichen Einschränkung, dass Sie von einem eingefrorenen Snapshot statt vom Floating Tag migrieren.
Für Workloads, die auf Logprob-Verteilungen gepinnt sind, prüfen Sie, ob die nachgelagerte Arbeit auf das strikte Structured-Outputs-Feature aktueller OpenAI-Modelle umziehen kann. Schema-Durchsetzung auf der Inferenzebene ist häufig ein saubererer Ersatz für logprob-bewusstes Sampling, als einem Nachfolge-Instruct-Modell hinterherzulaufen, das nicht existiert.
Für compliance-gepinnte Workloads ist der Re-Approval-Zyklus Teil der Migrationskosten. Beginnen Sie das Gespräch mit den Prüfern, bevor das Deprecation-Datum angekündigt wird; es unter Zeitdruck zu tun, ist teurer.
Für auf Forschungs-Reproduzierbarkeit gepinnte Workloads lautet die praktische Antwort: Veröffentlichen Sie Baseline-Zahlen gegen ein aktuelles Modell neben den historischen Zahlen und überführen Sie dann die Produktionspipeline. Die historischen Ergebnisse bleiben gegenüber archivierten Snapshots und aufgezeichneten Ausgaben reproduzierbar; das Live-System läuft gegen aktuelle Gewichte.
Für den Floating-Instruct-Kontext siehe gpt-3.5-turbo-instruct. Für das aktuelle OpenAI-Portfolio siehe GPT-4.1 und GPT-4o mini.
Was heute zu tun ist
Wenn dieser Identifier noch in Ihrem Code steckt, sind die Schritte konkret.
Erstens: Finden Sie die Aufrufstelle und dokumentieren Sie, warum der Pin existiert. Die oben genannten Gründe sind die häufigen; der Grund Ihres Teams kann spezifischer sein.
Zweitens: Führen Sie eine echte Evaluierung gegen Ihr Kandidaten-Migrationsziel durch. Neuere Modelle und das Chat-Interface brauchen anderes Prompting; das Übertragen der Instruct-Ära-Muster kann einen Nachfolger schlechter aussehen lassen, als er ist.
Drittens: Planen Sie die Umstellung für ein Release-Fenster Ihrer Wahl, nicht unter Deprecation-Druck. Der September-2023-Snapshot liegt am älteren Ende des OpenAI-Portfolios. Das Deprecation-Datum ist näher als das Release-Datum.
Auswahl
Wählen Sie diesen Snapshot nicht für neue Builds. Er ist veraltet, und die API-Oberfläche selbst läuft aus.
Für bestehende Integrationen ist das Migrationsziel ein aktuelles Chat-Interface-Modell — GPT-4o mini für chat-geformten Traffic, GPT-4.1 oder GPT-4.1 mini für Workloads, bei denen die 3.5-Reasoning-Obergrenze ohnehin schon eine Einschränkung war. Planen Sie bewusst.
Letzte technische Prüfung: 2026-05-22 — Tokonomix.ai
