Naar inhoud
Draait in:USGemaakt in:United States
OpenAI

gpt-3.5-turbo-instruct-0914

Tokonomix-redactie·Gecontroleerd door Mes Kalkan··

GPT-3.5-turbo-instruct-0914 is een tekstcompletiemodel ontwikkeld door OpenAI, uitgebracht in september 2023. In tegenstelling tot de chatgerichte GPT-3.5-turbo varianten, gebruikt dit model de oudere instructievolgende architectuur die oorspronkelijk werd geïntroduceerd met GPT-3, waardoor het geschikter is voor enkele-beurt completietaken in plaats van gesprekken met meerdere beurten. Het is ontworpen voor toepassingen die directe tekstvoortzetting, classificatie, transformatie en andere traditionele taalmodeloperaties vereisen zonder de overhead van conversationele opmaak. Het model verwerkt standaard tekstgeneratieaanvragen en volgt instructies die in prompts zijn ingebed. Het vertegenwoordigt een voortzetting van OpenAI's InstructGPT-lijn, die reinforcement learning from human feedback (RLHF) toepast om instructievolgende capaciteiten te verbeteren. De "0914" aanduiding geeft de specifieke momentopnamedatum van 14 september 2023 aan. Hoewel de contextvenstergrootte niet publiekelijk door OpenAI is bekendgemaakt, wordt verwacht dat het typische completietaken binnen standaard lengtebeperkingen aankan. Binnen OpenAI's modelaanbod neemt gpt-3.5-turbo-instruct-0914 een gespecialiseerde positie in naast de vaker gebruikte chatgeoptimaliseerde GPT-3.5 en GPT-4 varianten. Het bedient gebruikers die specifiek completiestijl outputs nodig hebben in plaats van conversationele reacties, waardoor het bijzonder relevant is voor legacy-toepassingen, bepaalde API-integraties en gebruikssituaties waar het completieparadigma directere controle over outputopmaak biedt. Het model biedt een alternatief interfacepatroon voor ontwikkelaars die de voorkeur geven aan of de traditionele completiebenadering vereisen boven chatgebaseerde interacties.

gpt-3.5-turbo-instruct-0914 van OpenAI is een veelzijdig taalmodel voor uiteenlopende zakelijke en creatieve toepassingen.

Tokonomix benchmark-samenvatting
Sectie 01

Prijsgeschiedenis

Directe provider-tarieven per miljoen tokens, plus een typische gespreks-kostschatting.

💰
API-tarieven — gpt-3.5-turbo-instruct-0914
$1.50 per 1M input-tokens
$2.00 per 1M output-tokens
≈ $0.0013 per typisch gesprek (800 tokens)
Input vs output prijs (per 1M tokens)
per 1M input-tokens$1.50
per 1M output-tokens$2.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.50

input / 1M

— no change

$2.00

output / 1M

— no change

2026-05-242026-05-242026-05-24
Input
Output
Price change
⟳ synced weekly
Sectie 02

Sterke & zwakke punten

Gebaseerd op benchmark-resultaten en geaggregeerde community-feedback over echte use-cases.

Sterke punten

Sterke algehele taalvaardigheidHeldere, coherente schrijfstijlBetrouwbare codeondersteuningUitstekende instructieopvolgingContextvenster van standaardGoede balans snelheid en kwaliteitMeertalige verwerking

Zwakke punten

Minder sterk dan topmodellenBeperkter bij zeer complexe takenNiet de goedkoopste optie
Sectie 03

Veelgestelde vragen

gpt-3.5-turbo-instruct-0914 is een veelzijdig model geschikt voor schrijven, samenvatten, coderen, Q&A en gespreksassistentie. Het biedt een goede balans tussen kwaliteit en snelheid.

Een betrouwbare, goed afgeronde keuze voor teams die schaalbaar willen werken met AI.

Tokonomix benchmark-samenvatting
Sectie 04

Beschikbaarheid

Beschikbaarheid

Nog geen meetdata

Er zijn nog niet genoeg API-aanroepen geregistreerd om beschikbaarheidsstatistieken voor dit model te tonen. Data verschijnt zodra het model live verkeer ontvangt.

Sectie 05

Tokonomix benchmark-oordelen

2026-05-24

Baseline vastgesteld voor GPT-3.5 Turbo Instruct instructievolgmodel

Dit is de eerste benchmark-evaluatie voor gpt-3.5-turbo-instruct-0914, waarmee de basisprestatiemetingen worden vastgelegd voor toekomstige vergelijkingen. Als instructievolgende variant van GPT-3.5 Turbo, geoptimaliseerd voor single-turn completion-taken in plaats van chat, vervult dit model een specifieke rol binnen het modellenaanbod van OpenAI. Zonder eerdere gegevens om mee te vergelijken, richt dit oordeel zich op het vastleggen van de initiële prestatie-footprint. Gebruikers moeten er rekening mee houden dat dit model afwijkt van de standaard GPT-3.5 Turbo qua ontwerpfilosofie, waarbij directe instructievoltooiing voorrang krijgt boven conversationele interacties. De instruct-variant blinkt doorgaans uit in rechtstreekse taakvoltooiing, classificatie en gestructureerde outputgeneratie, waar expliciete prompting voorspelbare resultaten oplevert. Aangezien dit een snapshot uit september 2014 betreft, kunnen gebruikers stabiel gedrag verwachten voor toepassingen die consistente instructievolgende capaciteiten vereisen. Toekomstige oordelen zullen prestatieafwijkingen, capaciteitsverbeteringen of gedragsveranderingen volgen ten opzichte van deze vastgestelde basislijn. Organisaties die productietoepassingen bouwen, doen er goed aan om vervolgbenchmarks te monitoren om te begrijpen hoe dit model zich ontwikkelt ten opzichte van deze initiële metingen.

Quality

Latency p50

Test runs

0

Basismetrieken vastgesteld Optimalisatie van instructievolging bevestigd
Sectie 06

Volledig modelprofiel

gpt-3.5-turbo-instruct-0914 — illustration 1

⚠️ Verouderd model. OpenAI heeft dit model ingetrokken. Voor nieuwe projecten, zie GPT-4o mini voor kostenefficiënt algemeen gebruik of GPT-4.1 voor sterkere redenering. Bestaande integraties moeten migratie plannen voordat het API-endpoint veroudert.

gpt-3.5-turbo-instruct-0914: de vastgepinde instruct-snapshot

gpt-3.5-turbo-instruct-0914 is de gedateerde snapshot van OpenAI's instruct-stijl GPT-3.5 Turbo, bevroren op de release van 14 september 2023. Het is de vastgepinde identifier voor de variant die 3.5 beschikbaar stelde via de legacy Completions API in plaats van de chat-interface.

Het model is verouderd. Het Completions API-oppervlak zelf wordt geleidelijk afgebouwd in OpenAI's lineup. Nieuwe projecten mogen deze identifier niet targeten.

Waarom deze specifieke datum telt

De september 2023-release was de snapshot waarop de meeste productieteams vastpinde wanneer ze reproduceerbaarheid nodig hadden ten opzichte van de instruct-variant. De release was van vóór de grotere 3.5-familie-wijzigingen die kwamen met de november 2023 DevDay-update — geen JSON-modus, geen parallelle functieaanroepen, niets van dat alles. Wat het had was een stabiel, goed begrepen model waartegen de vroege generatie LLM-ondersteunde producten was gebouwd.

Voor teams die evaluaties hadden ingediend of leverancierscontracten hadden opgeschreven die de instruct-variant refereerden, is deze snapshot vaak degene die wordt genoemd. Voor onderzoeksworkflows die reproduceerbaarheid nodig hadden ten opzichte van het model dat in een specifiek paper of benchmark van eind 2023 werd gebruikt, is dit vaak de identifier.

Het grotere plaatje is dat de instruct-variant precies bestond om code geschreven tegen de oudere Completions API een weg vooruit te geven zonder een chat-interface-herarchitectuur te forceren. Vastpinnen op een specifieke snapshot van die variant is dubbel conservatief — zowel het API-oppervlak als het modelgedrag zijn bevroren in de tijd.

Wat er in deze snapshot zit

De instruct-variant van GPT-3.5 Turbo zoals het stond in september 2023. 16.385-token contextvenster. Enkelvoudige-string-prompt-invoer via de legacy Completions API, enkelvoudige-string-completion-uitvoer. Logprobs direct beschikbaar via de API. Geen chat-opmaak, geen rol-gebaseerde prompting, geen van de chat-getrainde reactiepatronen.

Wat niet in deze snapshot zit is alles dat later in 3.5-releases landde. Geen JSON-modus. Geen parallelle functieaanroepen. Geen seed-parameter voor reproduceerbaarheid — wat mildelijk ironisch is gezien dit de snapshot is vastgepind voor reproduceerbaarheidsdoeleinden; je krijgt model-gewicht-stabiliteit zonder de API-niveau reproduceerbaarheidstooling.

Het modelgedrag is 3.5-generatie. Redeneerdiepte op dat niveau. Feitelijkheid die retrieval of review nodig had op feitelijke paden. Weigeringskalibratie die minder consistent was dan wat later landde.

Waarom teams er nog op vastpinnen

Drie redenen verschijnen in audits.

Ten eerste, stroomafwaartse code-afhankelijkheden op logprobs van deze snapshot. Classificatiepijplijnen, beperkt-decodering-systemen en gestructureerd-bemonsteringswerk gebouwd rondom de specifieke logprob-distributies van de september-snapshot kunnen regresseren wanneer ze worden bumped. Het modelgedrag van latere snapshots is vergelijkbaar maar de kansdistributies zijn niet identiek, en stroomafwaartse pijplijnen nauwkeurig genoeg afgestemd om het verschil te voelen zijn kleverig.

Ten tweede, gereguleerde workflows die deze exacte identifier goedkeurden. Sommige nalevingsreviews van eind 2023 noemden de september-snapshot specifiek en de hergoedkeuringscyclus is langzaam genoeg dat de pin niet is bewogen.

Ten derde, onderzoeksreproduceerbaarheid. Papers en interne evaluaties van eind 2023 die de instruct-variant gebruikten, refereren vaak aan deze snapshot, al dan niet expliciet. De pin laat die resultaten reproduceerbaar blijven.

Wat de afschrijvingskalender betekent

Dit is een van de oudere nog-oplosbare snapshots in de OpenAI lineup. Afschrijvingshorizonten voor gedateerde snapshots lopen twaalf tot achttien maanden onder OpenAI's typische schema. September 2023 is ruim voorbij het vroege einde van dat venster. Het feit dat het endpoint vandaag nog antwoordt is geen garantie dat het morgen antwoordt.

De migratieurgentie is reëel. Plan het actief. Stel een agendaherinnering in. Let op dat het migratiedoelwit geen andere instruct-snapshot is — het Completions API-oppervlak wordt afgebouwd, dus de migratie is naar de chat-interface op een huidig model, met het architectuurwerk dat dat impliceert.

Migratie

Hetzelfde patroon dat van toepassing is op de bredere instruct-variant is hier van toepassing, met de aanvullende beperking dat je migreert van een bevroren snapshot in plaats van van de zwevende tag.

Voor werklasten vastgepind op logprob-distributies, evalueer of het stroomafwaartse werk kan overstappen naar de strikte gestructureerde-uitvoer-functie op huidige OpenAI-modellen. Schema-handhaving op het inferentieniveau is vaak een schonere vervanging voor logprob-bewust samplen dan het achtervolgen van een opvolgend instruct-model dat niet bestaat.

Voor compliance-vastgepinde werklasten maakt de hergoedkeuringscyclus deel uit van de migratiekosten. Begin het gesprek met auditors vóór de afschrijvingsdatum wordt aangekondigd; het doen ervan onder tijdsdruk is duurder.

Voor onderzoeks-reproduceerbaarheid-vastgepinde werklasten is het praktische antwoord om basiscifers te publiceren tegen een huidig model naast de historische cijfers, en vervolgens de productiepijplijn over te zetten. De historische resultaten blijven reproduceerbaar tegen gearchiveerde snapshots en opgenomen uitvoer; het live systeem draait tegen huidige gewichten.

Voor de zwevende instruct-context, zie gpt-3.5-turbo-instruct. Voor de huidige OpenAI lineup, zie GPT-4.1 en GPT-4o mini.

Wat je vandaag moet doen

Als deze identifier nog in je code zit, zijn de stappen concreet.

Ten eerste, vind de aanroepsite en documenteer waarom de pin bestaat. De bovenstaande redenen zijn de gangbare; de reden van je team kan specifieker zijn.

Ten tweede, draai een echte evaluatie tegen je kandidaat-migratiedoelwit. Nieuwere modellen en de chat-interface hebben andere prompting nodig; het meenemen van de instruct-era patronen kan een opvolger slechter laten lijken dan hij is.

Ten derde, plan de cutover voor een releasevenster van je eigen keuze, niet onder afschrijvingsdruk. De september 2023-snapshot is aan het oudere einde van de OpenAI lineup. De afschrijvingsdatum is dichterbij dan de releasedatum.

Wanneer je het kiest

Kies deze snapshot niet voor nieuwe builds. Het is verouderd en het API-oppervlak zelf wordt afgebouwd.

Voor bestaande integraties is het migratiedoelwit een huidig chat-interface model — GPT-4o mini voor chat-achtig verkeer, GPT-4.1 of GPT-4.1 mini voor werklasten waarbij het 3.5-redeneerplafond al een beperking was. Plan bewust.

Laatste technische beoordeling: 2026-05-22 — Tokonomix.ai

gpt-3.5-turbo-instruct-0914 — illustration 2
Laatste automatische test
27 mei 2026 · 21:57 UTC · Benchmark
P50 latency
P95 latency
Fouten
1 / 6 runs
Laatst beoordeeld door Tokonomix-team·24 mei 2026