
GPT-4 is de oorspronkelijke frontier-release uit de GPT-4-familie van OpenAI — het model dat bij lancering in maart 2023 het ijkpunt werd waaraan elk volgend groot taalmodel werd afgemeten. De architectuurdetails werden toen achtergehouden en blijven tot op heden achtergehouden. De capaciteiten, het kostenprofiel en het deploymentverhaal zijn allemaal goed gedocumenteerd door jarenlang productiegebruik.
Het is niet langer de aanbevolen standaardkeuze voor nieuwe ontwikkelingen. Het is ook niet uitgefaseerd. De middenweg is de juiste framing.
Waarom dit model ertoe deed
De komst van GPT-4 resette wat teams verwachtten van een taalmodel dat in productie kon worden ingezet. Drie specifieke verschuivingen.
Redeneren. GPT-4 kon multi-step inferentie aan elkaar schakelen op een manier die de 3.5-generatie niet kon. Juridische contractanalyse, multi-documentsynthese, code-generatie voor nieuwe functionaliteit vanuit vage specificaties — dit alles verschoof van "interessante demo, fragiele output" naar "productie-inzetbaar met passende reviewlagen." De kwalitatieve kloof met 3.5 was van het soort dat je binnen het eerste testuur in evalresultaten voelde.
Meertaligheid. Multi-language coverage was een stapsgewijze verandering. Europees administratief proza, medische terminologie, juridische taal over meerdere jurisdicties — allemaal materieel beter verwerkt dan de vorige generatie. Voor Europese enterprise-teams in het bijzonder was dit de ontgrendeling die grensoverschrijdende productfuncties inzetbaar maakte.
Tool use. Function calling rijpte tot iets waarop productieteams daadwerkelijk agent-loops bovenop konden bouwen. De schemadiscipline was niet zo strak als wat latere generaties zouden leveren, maar het was strak genoeg dat de eerste golf agent-frameworks eromheen kon worden gewikkeld.
Wat volgde doorheen 2024 en 2025 — GPT-4 Turbo, GPT-4o, GPT-4.1, GPT-5 — waren allemaal verfijningen en uitbreidingen van capaciteiten die GPT-4 eerst vestigde.
Wat het mist tegenover huidige modellen
Het contextvenster van 8.192 tokens is de meest zichtbare beperking. Na een jaar waarin contexten van een miljoen tokens standaard werden in de frontier-laag, is 8k genoeg voor chatverkeer maar niet voor enige documentzware workload. Documentverwerking op dit model betekende typisch chunking-strategieën die huidige modellen overbodig maken.
Geen vision input. De vision-capable varianten kwamen later. Het basis-GPT-4-model is alleen tekst.
Geen audio-oppervlak. Hetzelfde verhaal. De audiocapaciteiten arriveerden met de 4o-generatie.
Redenerendiepte. De zwaarste planning- en syntheseprompts die huidige frontier-modellen gracieus behandelen — GPT-5, Claude Opus 4.7, de deep-research varianten — liggen zichtbaar buiten de comfortzone van GPT-4. Het model behandelt ze, maar de outputkwaliteit daalt merkbaar.
Snelheid. Verbeteringen in de inference-stack over de afgelopen twee jaar hebben het latentieprofiel van nieuwere modellen ver onder het punt getrokken waar de oorspronkelijke GPT-4 zit. Voor interactieve use cases wordt het verschil onmiddellijk gevoeld.
Waarom teams het nog steeds draaien
Twee redenen naast historische traagheid.
Ten eerste, compliance-regimes die deze specifieke identifier goedkeurden. GPT-4 is het model dat door de meeste auditcycli kwam in 2023 en 2024 omdat het de beschikbare frontier-optie was voor die periode. Sommige gereguleerde workflows draaien nog steeds GPT-4 omdat de kosten van heraudit op een nieuwer model aanzienlijk zijn en de workload nog niets nieuwers nodig heeft.
Ten tweede, eval-stabiliteit voor downstream-pipelines. Teams die parsers, classifiers of testsuites strak tegen de specifieke outputstijl van GPT-4 hebben gebouwd, pinnen soms voor stabiliteit terwijl ze de downstream-tooling in hun eigen tempo migreren.
Beide redenen hebben een houdbaarheidsdatum. Nieuwe auditcycli defaulten naar huidige modellen; nieuwe pipelines worden niet meer gebouwd tegen GPT-4.
Migratiepaden
Het juiste migratiedoel hangt af van de workload-vorm.
Voor workloads waar GPT-4 de frontier-keuze was en huidige frontier-capaciteit ertoe doet, is GPT-4.1 of GPT-5 de natuurlijke upgrade. Beide brengen veel langere context, materieel sterker redeneren en strakkere structured-output-gedrag. De kosten zijn lager, niet hoger.
Voor workloads die op GPT-4 draaiden omdat niets goedkopers destijds goed genoeg was, is gpt-4.1-mini vaak de juiste bestemming. De kwaliteit op de meeste productieprompts is vergelijkbaar; het kosten- en latentieprofiel zijn materieel beter.
Voor multimodale workloads die de 4o-generatie voorafgingen en momenteel het gebrek aan vision of audio omzeilen door externe services, is de natuurlijke stap consolideren naar GPT-4o of GPT-4.1 met native multimodale ondersteuning. De architecturale vereenvoudiging alleen al is meestal de migratiekosten waard.
Deployment-notities
Het API-oppervlak is Chat Completions, dezelfde vorm die elk volgend OpenAI-model gebruikt. Streaming, function calling, structured JSON-mode output waar het schema redelijk is — alles gedraagt zich ruwweg zoals het doet op nieuwere modellen.
Prompt caching is niet zo ontwikkeld op GPT-4 als op nieuwere modellen. De hergebruik-efficiëntiewinsten die zichzelf terugbetalen op GPT-4.1 met stabiele long-context prefixes zijn hier kleiner.
Regionale residency is hetzelfde OpenAI-verhaal: directe API draait op Azure-infrastructuur zonder region pinning, Azure OpenAI Service biedt regionale deployments onder een apart contract. Voor teams met harde EU-residency-eisen is een OVH-gehoste Mistral- of Llama 3-instantie een ander gesprek; zie /usecases/local.
Het kiezen
Gebruik GPT-4 vandaag wanneer:
- Een compliance-regime deze specifieke identifier goedkeurde en de heraudit-cyclus bezig is.
- Een downstream-pipeline strak genoeg is afgestemd op de outputstijl van het model dat de migratiekosten het upgrade-voordeel overtreffen, en het team een plan heeft om dat te fixen.
- Historisch vergelijkingswerk het oorspronkelijke GPT-4-referentiepunt vereist.
Voor nieuwe builds, richt op GPT-4.1, GPT-4.1 mini, of een van de GPT-5-familiemodellen afhankelijk van de workload-vorm. De 4-generatie legde de lat. Het is niet meer de lat.
Voor de cross-category vergelijking zie /benchmarks/leaderboard. Voor de bredere OpenAI-lineup richting, zie GPT-4.1.
Laatste technische review: 2026-05-22 — Tokonomix.ai

