Tier B — Productie

Draait in:USGemaakt in:United States

$2.00

output · per 1M tokens (inkoopbasis)

Kosten

2,427 ms

Antwoordsnelheid

100 / 100

Intelligentie

Verdict — samenvattingLIVE

● LIVE

nu · 2026-07-26

Quality drops 45 points with factual and reasoning scores falling to zero

✗ Quality dropped 45 points✗ Factual and reasoning scores zero✓ Multilingual performance remains excellent✗ Latency increased 3 percent

This benchmark window shows a significant degradation in gpt-5-mini-2025-08-07 performance, with the overall quality score plummeting from 81.3 to 36.3 out of 100. The most alarming change is the complete failure in factual and reasoning categories, both scoring zero compared to their absence from previous measurements where coding achieved perfect scores. This suggests either a regression in the model's core capabilities or fundamental issues with these newly-tested aspects. Multilingual performance remains the model's strongest area, maintaining near-perfect scores at 100 in the current window versus 99 previously. Creative tasks held steady at 45 across both windows, indicating some consistency in generation capabilities. Latency increased slightly from 6548ms to 6742ms at the median, representing a modest 3% slowdown that is unlikely to impact most use cases significantly. The previous window highlighted eight major capabilities including reasoning and vision support, but the current results suggest these additions may not be functioning as intended. Users should exercise caution when deploying this model for factual retrieval or logical reasoning tasks until these critical issues are addressed. The model appears most reliable for multilingual applications at present.

Quality

36.3

Latency p50

6,742 ms

Test runs

1 van 11

Beeld & uitlegLIVE

OpenAI

gpt-5-mini-2025-08-07

Tier B — Productie

Tokonomix-redactie·Gecontroleerd door Mes Kalkan·Gepubliceerd 22 mei 2026·Laatst gecontroleerd 26 mei 2026

GPT-5-mini-2025-08-07 is een tekstgeneratiemodel ontwikkeld door OpenAI, uitgebracht als onderdeel van de GPT-5-familie in 2025. Zoals de "mini"-aanduiding aangeeft, vertegenwoordigt dit model een kleinere, efficiëntere variant binnen het aanbod, ontworpen om capaciteit en rekenefficiëntie in balans te brengen. Het verwerkt en genereert mensachtige tekst op basis van invoerprompts, geschikt voor toepassingen zoals contentgeneratie, conversational agents, tekstanalyse en algemene taaltaken. Het model beschikt over standaard tekstgeneratiemogelijkheden zonder gespecialiseerde multimodale functies, met focus op kernbegrip en -productie van taal. De grootte van het contextvenster is niet openbaar gemaakt, hoewel het de fundamentele architectuurkenmerken van de GPT-5-serie behoudt, waaronder verbeterde redeneercapaciteiten en nauwkeurigere feitelijke antwoorden vergeleken met eerdere generaties. De releasedatum van augustus 2025 suggereert dat het trainingsdata en architecturale verfijningen bevat die tot dat moment beschikbaar waren. Binnen OpenAI's modelaanbod neemt GPT-5-mini een positie in als toegankelijke optie voor ontwikkelaars en organisaties die capabele taalverwerking nodig hebben zonder de rekenkundige overhead van volwaardige GPT-5-modellen. Het bedient gebruikssituaties waarin responssnelheid en resource-efficiëntie prioriteit hebben naast kwaliteit, waardoor het geschikt is voor high-throughput toepassingen, embedded systemen of scenario's met infrastructuurbeperkingen. Het model behoudt compatibiliteit met OpenAI's standaard API-infrastructuur en tooling-ecosysteem.

GPT-5-mini-2025-08-07 brengt de nieuwste generatie taalmodellering naar een compacter formaat, waarbij OpenAI inzet op snelheid en efficiëntie zonder de fundamentele capaciteiten van de GPT-5-familie op te offeren.
— Tokonomix modelanalyse

Mogelijkheden

toolssource: litellmvisionjson modepdf inputreasoningjson schemaparallel toolsprompt cachingmax output tokens: 128000

GPT-5 Mini (2025-08-07 snapshot): de oudste gedateerde mini-pin

Dit is de gedateerde snapshot van de oorspronkelijke GPT-5 Mini, bevroren op de lancering van 7 augustus 2025. Het is de meest bejaarde gedateerde snapshot in de GPT-5 Mini-familie — vastgepind door teams die Mini adopteerden bij de GPT-5-lancering en sindsdien niet gemigreerd zijn. De bepalende operationele vraag voor deze pin is niet langer "moet ik hem vastpinnen" maar "wanneer plan ik de migratie ervan weg, en waarnaar verhuizen we."

Het deprecation-runway-argument

OpenAI publiceert deprecatietijdlijnen voor gedateerde snapshots. Het patroon over modelgeneraties heen is consistent geweest: snapshots worden uiteindelijk uitgefaseerd, met minstens enkele maanden waarschuwing vooraf. De exacte datum wordt aangekondigd wanneer de aankondiging plaatsvindt, niet vooraf te voorspellen.

Voor een snapshot die er is sinds de GPT-5-lancering, is de vraag niet of deprecatie eraan komt. Het is of je een migratieplan klaar hebt wanneer OpenAI de tijdlijn publiceert. Teams die het langst tegen deze pin draaien hebben de meest geaccumuleerde technische investering — prompts gekalibreerd op het specifieke gedrag van het model, downstream parsing die afhangt van output-eigenaardigheden, evaluatieframeworks die naar deze snapshot verwijzen als hun baseline. Dat alles moet verhuizen wanneer deze snapshot wordt uitgefaseerd.

De mitigatie is vooruit plannen. Identificeer naar welke nieuwere Mini je zult migreren. Voer periodieke evaluaties uit tegen dat doelwit. Bouw het migratie-prompt-engineering-werk op als een gekend project in plaats van een crisisrespons. De kosten zijn klein als je plant. Ze zijn veel groter als het gebeurt onder deadlinedruk wanneer de deprecatiedatum arriveert.

Wat deze snapshot vastlegt

De lancering van GPT-5 Mini in augustus 2025: lanceringsgewichten, lanceringsgedrag bij classificatie en extractie, lanceringslatensieprofiel, lancering vision-encoder-configuratie voor de grootteklasse. Het model is sindsdien niet veranderd.

De verbeteringen die de bredere GPT-5-lijn heeft geaccumuleerd in daaropvolgende generaties — betere classificatienauwkeurigheid, strakkere gestructureerde output, verbeterde vision-capaciteit, kennis van ontwikkelingen na midden 2025 — geen daarvan verschijnt hier.

Onder de motorkap

Architecturaal is dit de GPT-5 Mini transformer-decoder op een kleinere parameterschaal dan basis 5.0. Het model accepteert gemengde tekst- en beeldinvoer en produceert alleen tekstoutput. OpenAI heeft geen parameteraantallen gepubliceerd.

Tokenisatie gebruikt het standaard GPT-5 BPE-vocabulaire. Beeldinvoer wordt tile-gecodeerd tegen een vaste tokenkosten per tile. Trainings-cutoff valt medio 2025. Het model kent mainstream taalstandaarden en frameworkversies actueel tot die periode.

De cost-per-token- en latency-per-request-profielen zijn vergrendeld op de lanceringswaarden.

Waar het vandaag staat

Tegenover huidige small-tier-aanbiedingen staat de augustus 2025-snapshot van GPT-5 Mini ruim onder de nieuwere GPT-5 mini's op de meeste benchmarkdimensies. Het intelligentieklassement volgt de vergelijkende positie; de kloof naar huidige snapshots is aan het groeien naarmate nieuwere generaties landen.

Voor routineuze workloads — basale classificatie, simpele extractie, korte gestructureerde output, klantenservice-automatisering op goed betreden paden — blijft de snapshot nuttig werk doen. Voor alles wat kennis na medio 2025 vereist, recente vision-capaciteit, of de kwaliteitsverbeteringen van nieuwere mini's, is het model steeds vaker de verkeerde keuze.

Voor contentwerkstromen aan het zeer routinematige uiteinde en data-extractie op standaarddocumenten is de snapshot nog steeds functioneel. Voor meer veeleisende workloads is de kloof naar nieuwere pins zichtbaar.

Wanneer deze pin op zijn plaats houden

De gevallen om op deze snapshot te blijven zijn smal en krimpen:

Je hebt nauw gekalibreerde downstream-tooling tegen de specifieke outputpatronen van dit model en migratiekosten blijven hoger dan de cumulatieve kosten van blijven zitten.

Je bevindt je in een gereguleerde context waar deze specifieke pin deel uitmaakt van een actieve auditcyclus en het veranderen van modellen hercertificering vereist die nog niet getriggerd is.

Je workload is werkelijk routinematig en de kwaliteitskloof naar nieuwere mini's beïnvloedt de uitkomsten op geen enkele manier die je kunt meten.

Je draait langlopende A/B-experimenten waar de controlearm werkelijk gefixeerd moet blijven voor de duur van de test, en de test is nog niet afgerond.

Wanneer nu migreren

De duidelijke triggers:

OpenAI heeft de deprecatietijdlijn voor deze snapshot gepubliceerd, en de datum is dichtbij genoeg om actieve migratieplan vereisen.

Je workload is gegroeid om capaciteiten nodig te hebben die deze generatie niet heeft — kennis na de cutoff, vision-kwaliteit, structured-output-betrouwbaarheid die nieuwere mini's bieden.

Je evaluatieframework toont de cumulatieve kwaliteitskloof die betekenisvolle uitkomsten kost — meer supporttickets, meer opschoonwerk, meer voor klanten zichtbare problemen.

Je bent op een natuurlijk heropbouwmoment in je pipeline waar de kosten van migratie lager zijn dan normaal.

Het migratiedoel kiezen

De natuurlijke doelen zijn de gedateerde snapshots van nieuwere Mini-generaties: 5.2 Mini, 5.4 Mini, 5.5 Mini, of welke actueel is wanneer je migreert. De keuze hangt af van dezelfde overwegingen als elke Mini-keuze: capaciteitsbehoeften, kostengevoeligheid, bereidheid om later opnieuw te migreren versus de laatste beschikbare pinnen.

De meeste teams die van deze snapshot migreren eindigen op de laatste stabiele gedateerde Mini die lang genoeg in het veld is geweest voor de vroege-leven-patches om zich te hebben gesetteld. Dat geeft je de kwaliteitswinsten van de nieuwere generatie met de operationele stabiliteit van een volwassen pin.

Het migratiepatroon

Pin de doelsnapshot in pre-release. Laat je bestaande prompts erdoorheen lopen. Verwacht wat aanpassing te moeten doen omdat outputpatronen licht verschillen tussen generaties. Valideer tegen je evaluatiesuite. Update downstream parsing als formatquirks zijn veranderd. Schakel productieverkeer over. Haal de oude pin uit gebruik.

Het hele project neemt meestal een paar ingenieurs-weken in beslag voor een workload van gematigde complexiteit. Vooraf gedaan voor deprecatie is het een gepland project. Onder deadlinedruk gedaan is het een brandoefening.

Alternatieven

Voor workloads die vastgepind mini-tier-gedrag nodig hebben bij een andere provider bieden de vergelijkbare gedateerde snapshots van Anthropic en Google hetzelfde pinningspatroon tegen potentieel verschillende kosten-kwaliteitsverhoudingen.

Voor kostengeoptimaliseerde workloads waar het OpenAI-ecosysteem niet dragend is, bieden kleine open-weights-classifiers die draaien op je eigen infrastructuur het residency-verhaal en de operationele voorspelbaarheid die floating slugs niet kunnen.

Laatste technische review: 2026-05-22 — Tokonomix.ai

Provider-vergelijkingLIVE

Provider-vergelijking

Vergelijk elke aanbieder van dit model — kostenbasis, kwaliteit, latency en uptime.

Azure OpenAI (EU - Sweden)EU

Invoerkosten✓ beste$0.2500

Uitvoerkosten$2.00

KwaliteitNog niet getest

Latency (p50)Nog niet getest

UptimeNog niet getest

Kosten per 1M tokens (kostenbasis)

OpenAIVSDit aanbod

Invoerkosten$0.2500

Uitvoerkosten$2.00

Kwaliteit✓ beste100.0

Latency (p50)✓ beste2,427 ms

UptimeNog niet getest

Kosten per 1M tokens (kostenbasis)

Consensus-intelligentie

MODEL-BREED

Consensus-signalen zijn model-breed — nog niet per provider gesplitst.

—

Agent-bruikbaarheid (1–10)

—

Precisie-score

Unieke bevindingen

Gevalideerde verzoeken

Community-stemmenLIVE

Community-stemmen

Wat echte bezoekers vinden — per provider.

Azure OpenAI (EU - Sweden)EU

Nog geen community-stemmen.

OpenAIVS

Nog geen community-stemmen.

Meer resultaten — per provider

Kwaliteit per categorie

Game-rubriek

Nog geen data.

Jury-oordeel

■ OK 57%■ Deels 0%■ Fout 43%

Games & arena

Nog geen data.

Snelheid & gezondheid

2,427 ms

Latency (p50)

—

Uptime

Kwaliteit per categorie

Game-rubriek

Nog geen data.

Jury-oordeel

■ OK 57%■ Deels 0%■ Fout 43%

Games & arena

Nog geen data.

Snelheid & gezondheid

2,427 ms

Latency (p50)

—

Uptime

Vraag & antwoord — bladerenLIVE

1 van 80

🧠 intelligentieOpenAImultilingual · 2026-07-26score: 100

Bir mağazada %20 indirim uygulanıyor. 150 TL olan bir ürün indirimden sonra kaç TL olur?

%20 indirim demek fiyatın %80'ine düşmesi demektir. 150 × 0,80 = 120 Cevap: 120 TL.

Test-historie — alle providersLIVE

Kwaliteitsscore over tijdlaatste 38

Snelheid — p50-latentie over tijd

Een trend verschijnt zodra dit model op een paar verschillende dagen is getest.

📝Verdict — samenvattingLIVE

Quality drops 45 points with factual and reasoning scores falling to zero

🖼️Beeld & uitlegLIVE

gpt-5-mini-2025-08-07

Mogelijkheden

Het deprecation-runway-argument

Wat deze snapshot vastlegt

Onder de motorkap

Waar het vandaag staat

Wanneer deze pin op zijn plaats houden

Wanneer nu migreren

Het migratiedoel kiezen

Het migratiepatroon

Alternatieven

📊Provider-vergelijkingLIVE

🧠Consensus-intelligentie

👥Community-stemmenLIVE

🔬Meer resultaten — per provider

💬Vraag & antwoord — bladerenLIVE

🗂️Test-historie — alle providersLIVE

Verdict — samenvattingLIVE

Beeld & uitlegLIVE

Provider-vergelijkingLIVE

Consensus-intelligentie

Community-stemmenLIVE

Meer resultaten — per provider

Vraag & antwoord — bladerenLIVE

Test-historie — alle providersLIVE