Naar inhoud
Draait in:USGemaakt in:United States
OpenAI

gpt-realtime-2025-08-28

Tokonomix-redactie·Gecontroleerd door Mes Kalkan··

GPT-Realtime-2025-08-28 is een multimodaal taalmodel ontwikkeld door OpenAI, uitgebracht als onderdeel van de doorlopende evolutie van de GPT-architectuur van het bedrijf. Dit model vertegenwoordigt OpenAI's benadering van real-time conversationele AI, specifiek ontworpen voor toepassingen die interacties met lage latentie vereisen, zoals spraakassistenten, live klantenondersteuning en interactieve dialoogsystemen. In tegenstelling tot traditionele tekstaanvullingsmodellen is het geoptimaliseerd voor streamingrespons en het behouden van conversationele context met minimale vertraging tussen gebruikersinvoer en modeloutput. Het model ondersteunt standaard tekstgeneratiecapaciteiten en verwerkt zowel tekst- als audio-invoer, waardoor natuurlijke spraakgebaseerde interacties mogelijk zijn. Technische specificaties geven aan dat het voortbouwt op de transformer-architectuur die ten grondslag ligt aan OpenAI's GPT-serie, hoewel de exacte contextvenstergrootte niet publiekelijk is bekendgemaakt door de aanbieder. Het model bevat verbeteringen in responslatentie en conversationele coherentie vergeleken met eerdere iteraties, waardoor het bijzonder geschikt is voor scenario's waar onmiddellijke feedback essentieel is. Binnen OpenAI's modelaanbod neemt GPT-Realtime-2025-08-28 een gespecialiseerde positie in, gericht op synchrone, interactieve gebruikssituaties in plaats van batchverwerking of asynchrone taken. Het complementeert OpenAI's bredere GPT-4-familie door specifieke vereisten aan te pakken voor real-time toepassingen waar traditionele API-gebaseerde modellen onaanvaardbare vertragingen kunnen introduceren. Het model is toegankelijk via OpenAI's API-infrastructuur en is bedoeld voor ontwikkelaars die conversationele interfaces en spraakgestuurde applicaties bouwen.

gpt-realtime-2025-08-28 maakt vloeiende, realtime spraakgesprekken mogelijk met minimale vertraging.

Tokonomix benchmark-samenvatting
Sectie 01

Prijsgeschiedenis

Directe provider-tarieven per miljoen tokens, plus een typische gespreks-kostschatting.

💰
API-tarieven — gpt-realtime-2025-08-28
$4.00 per 1M input-tokens
$16.00 per 1M output-tokens
≈ $0.0056 per typisch gesprek (800 tokens)
Input vs output prijs (per 1M tokens)
per 1M input-tokens$4.00
per 1M output-tokens$16.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$4.00

input / 1M

— no change

$16.00

output / 1M

— no change

2026-05-242026-05-242026-05-24
Input
Output
Price change
⟳ synced weekly
Sectie 02

Sterke & zwakke punten

Gebaseerd op benchmark-resultaten en geaggregeerde community-feedback over echte use-cases.

Sterke punten

Ultralaag latentie (real-time)Gelijktijdige spraak in- en uitvoerBidirectionele audiostroomNatuurlijke gespreksflowMeertalige ondersteuningWebSocket API-toegankelijk

Zwakke punten

Hogere kosten voor realtime gebruikComplexere integratie nodigStabiele verbinding vereist
Sectie 03

Veelgestelde vragen

gpt-realtime-2025-08-28 is ontworpen voor realtime gespreksapplicaties waarbij spraak direct wordt verwerkt en beantwoord zonder merkbare vertraging.

De go-to keuze voor voice-applicaties waar snelheid en conversatieflow doorslaggevend zijn.

Tokonomix benchmark-samenvatting
Sectie 04

Beschikbaarheid

Beschikbaarheid

Nog geen meetdata

Er zijn nog niet genoeg API-aanroepen geregistreerd om beschikbaarheidsstatistieken voor dit model te tonen. Data verschijnt zodra het model live verkeer ontvangt.

Sectie 05

Tokonomix benchmark-oordelen

2026-05-24

Eerste benchmark stelt basisprestaties vast voor kerncapaciteiten

Het gpt-realtime-2025-08-28 model legt zijn initiële prestatiebasis vast met gemeten resultaten op standaardbenchmarks. In wiskundig redeneren behaalt het model 83,6% op GSM8K en 54,6% op MATH, wat wijst op solide elementaire probleemoplossing met matige prestaties bij gevorderde wiskunde. De programmeervaardigheden tonen 81,7% op HumanEval en 86,0% op MBPP, wat duidt op sterke fundamentele programmeercapaciteiten. Het model scoort 88,4% op MMLU, wat brede kennis over academische domeinen weerspiegelt. Het opvolgen van instructies bereikt 72,9% op IFEval, wat een redelijke naleving van complexe richtlijnen suggereert met ruimte voor verbetering. De GPQA-prestatie ligt op 49,0%, wat wijst op matige expert-redeneervaardigheden. Creatief schrijven scoort 22,5 op Arena-Hard, terwijl MGSM meertalige wiskunde 76,9% behaalt. Als realtime-gericht model leggen deze benchmarks de basis voor het volgen van toekomstige verbeteringen. Gebruikers moeten begrijpen dat dit het startpunt vertegenwoordigt voor deze modelvariant, met prestatiekenmerken die conversationele en interactieve toepassingen verkiezen boven pure benchmarkoptimalisatie. De resultaten wijzen op een capabel algemeen model met bijzondere sterkte in programmeer- en fundamentele redeneertaken.

Quality

Latency p50

Test runs

0

Sterke programmeerprestaties vastgesteld Solide elementair wiskundig redeneren Gematigde geavanceerde wiskundige vaardigheid Deskundig redeneren behoeft verbetering
Sectie 06

Volledig modelprofiel

gpt-realtime-2025-08-28 — illustration 1
gpt-realtime-2025-08-28: de augustusmomentopname van OpenAI's oorspronkelijke voice-native model

De augustus 2025-alias van gpt-realtime is de momentopname die het oorspronkelijke gedrag bij release van OpenAI's vlaggenschip-spraakmodel vastlegt. Dit is de versie om vast te zetten als je productiepijplijn was gekalibreerd tegen het lanceringstijdperk van gpt-realtime en je nog niet klaar bent om opnieuw te valideren tegen de latere 1.5-gewichten of om de zwevende gpt-realtime-alias te volgen terwijl deze vooruitschuift.

Wat de momentopname vastlegt

Deze momentopname legt gpt-realtime vast zoals het bij de lancering werd geleverd: de uniforme audio-tekst-transformerarchitectuur, WebSocket-gebaseerde persistente streamingverbindingen, functie-aanroep en gestructureerde outputs beschikbaar in-stream, spraakactiviteitsdetectie voor beurtwissel. De functionaliteitsomvang is precies wat de oorspronkelijke gpt-realtime-pagina beschrijft, bevroren bij de augustus 2025-gewichten.

Latentie, stemkarakter, beurtwisselgedrag, onderbreking-afhandeling, meertalige dekking. Al deze aspecten zijn vergrendeld op het gedrag uit het lanceringstijdperk. De afweging is dat je niet profiteert van de verbeteringen die OpenAI in latere momentopnamen heeft geleverd, het meest zichtbaar de strakkere beurtwissel en de betere Nederlandse en Poolse synthese die landden in gpt-realtime-1.5.

Voor workflows waarbij het oorspronkelijke gedrag datgene is waartegen je prompts, je evaluatieharnas en je end-to-end-tests werden gekalibreerd, is vastleggen op deze momentopname de juiste keuze. De gedateerde alias is het contract dat je beschermt tegen stille regressies wanneer OpenAI de zwevende gpt-realtime-naam bijwerkt.

Wanneer vastleggen op augustus zinvol is

Productie-implementaties die vóór eind 2025 live gingen en een stabiel gedragsprofiel hebben tegen deze momentopname. Gereguleerde workflows waar reproduceerbaarheid voor auditdoeleinden exact hetzelfde modelgedrag over een lange periode vereist. Voice-product QA-suites waarbij het regressietest-corpus is gekalibreerd op de augustus-outputdistributie en valse alarmen zou genereren als het onderliggende model verschoof.

Voor nieuwe builds en exploratief werk is dit niet het juiste startpunt. Nieuwe implementaties zouden moeten standaardiseren op gpt-realtime-1.5 of de zwevende gpt-realtime-naam volgen. De augustusmomentopname is een stabiliteitsanker voor bestaande productie, geen toekomstgerichte keuze.

Het migratiepad van deze momentopname naar 1.5 is laag-risico. Promptbibliotheken en gespreksstromen dragen netjes over omdat het API-oppervlak niet veranderde. Wat wel veranderde zijn subtiele gedragsdetails: beurtwissel-timing, onderbreking-afhandeling, meertalige synthesekwaliteit. Als je testharnas deze dimensies dekt, zul je de verbeteringen zien; zo niet, dan merk je het verschil misschien niet op, in welk geval de migratie in wezen gratis is.

Waar het tekortschiet vergeleken met 1.5

De meest zichtbare kloof zit bij beurtwissel in lawaaierige omgevingen. De augustusmomentopname begint soms een reactie een paar honderd milliseconden voordat de gebruiker volledig klaar is, vooral wanneer omgevingsgeluid valse einde-van-spraak-detectie triggert. De 1.5-gewichten hanteren dit geval veel netter.

De Nederlandse en Poolse synthesekwaliteit blijft aanzienlijk achter bij de 1.5-release. Als je implementatie Europese meertalige workloads bedient waar deze talen ertoe doen, is het hoorbare verschil in synthesekwaliteit groot genoeg om de migratie waard te zijn.

Onderbreking-afhandeling laat het model soms een tel doorpraten nadat de gebruiker heeft onderbroken, waardoor overlappend spreken ontstaat dat gebruikers opmerken. De 1.5-release behandelt dit gracieuzer.

Geen van deze faalwijzen maakt de augustusmomentopname onbruikbaar. Het zijn kwaliteitsverbeteringen in plaats van fundamentele beperkingen. Als je implementatie volwassen en stabiel is op deze momentopname, is de vraag of de verfijningen het hervalidatiewerk waard zijn, niet of het augustusgedrag acceptabel is.

Praktische opmerkingen en alternatieven

Als je tegen deze momentopname in productie draait en moet plannen voor eventuele migratie, is het pad om een parallel evaluatiespoor op te zetten tegen gpt-realtime-1.5, je volledige testcorpus te draaien, de gedragsdeltas te documenteren en over te schakelen wanneer het deltarapport acceptabel risico toont. De zwevende gpt-realtime-pointer blijft vooruit bewegen, dus uiteindelijk betekent vastleggen op augustus dat je op een steeds ouder model draait ten opzichte van de rest van OpenAI's stack.

Voor budget-tier spraakwerk waar je niet de volledige reasoning-diepte en tool-use-sofisticatie nodig hebt, zijn gpt-realtime-mini en zijn gedateerde varianten de alternatieven. Voor pure audio-mini-workloads die de conversationele loop niet nodig hebben, dekt gpt-audio-mini die smallere taak.

EU-data-residency wordt niet standaard vervuld bij deze momentopname, net zomin als bij de nieuwere. Regionale gateways met gegevensverwerkingsovereenkomsten blijven de praktische workaround voor gereguleerde Europese implementaties. Die beperking is niet momentopname-afhankelijk.

Laatste technische review: 2026-05-22 — Tokonomix.ai

gpt-realtime-2025-08-28 — illustration 2
Laatste automatische test
31 mei 2026 · 04:26 UTC · Benchmark
P50 latency
P95 latency
Fouten
1 / 6 runs
Laatst beoordeeld door Tokonomix-team·26 mei 2026