Worden alle bronnen vermeld?

Ja, het model citeert doorgaans de webpagina's die zijn gebruikt voor het samenstellen van het antwoord.

Is het model geschikt voor feitenchecking?

Het model kan helpen bij feitenchecking via realtime zoekresultaten, maar kritische verificatie blijft de verantwoordelijkheid van de gebruiker.

Hoe actueel zijn de zoekresultaten?

Zoekresultaten zijn in principe actueel op het moment van de query, afhankelijk van de indexatiesnelheid van de gebruikte zoekmachine.

Tier C — Specialist

Draait in:USGemaakt in:United States

OpenAI

gpt-5-search-api

Tier C — Specialist

Tokonomix-redactie·Gecontroleerd door Mes Kalkan·Gepubliceerd 22 mei 2026·Laatst gecontroleerd 26 mei 2026

GPT-5-Search-API is een taalmodel ontwikkeld door OpenAI dat standaard tekstgeneratiecapaciteiten integreert met zoekfunctionaliteit. Dit model vertegenwoordigt een evolutie in OpenAI's benadering van informatieophaling en -synthese, ontworpen om de redeneercapaciteiten van grote taalmodellen te combineren met toegang tot actuele informatie via geïntegreerde zoekmechanismen. Het model is gepositioneerd om taken af te handelen die zowel taalbegrip vereisen als het vermogen om externe informatie te raadplegen of op te halen. De technische specificaties van GPT-5-Search-API omvatten standaard tekstgeneratiecapaciteiten, hoewel gedetailleerde parameters zoals modelgrootte en samenstelling van trainingsdata niet publiekelijk zijn vrijgegeven door OpenAI. De lengte van het contextvenster blijft ongespecificeerd in beschikbare documentatie. Het onderscheidende kenmerk van het model is de zoekintegratie, die het differentieert van pure tekstgeneratiemodellen door informatieophaling-workflows mogelijk te maken binnen het generatieproces. Binnen OpenAI's modelportfolio neemt GPT-5-Search-API een gespecialiseerde niche in gericht op zoekondersteunde generatietaken. Het staat naast andere GPT-5-varianten die mogelijk verschillende capaciteitsprofielen of optimalisatiedoelen bieden. Het model is geschikt voor toepassingen die feitelijke informatieophaling vereisen, onderzoeksondersteuning, het beantwoorden van vragen met actuele data, en andere gebruikssituaties waarbij het combineren van taalgeneratie met zoekfunctionaliteit waarde biedt. Het richt zich op ontwikkelaars en organisaties die toepassingen bouwen die profiteren van modellen die zowel coherente tekst kunnen genereren als toegang hebben tot informatie buiten hun trainingsdata.

gpt-5-search-api combineert taalmodelkracht met realtime webzoekfuncties voor actuele antwoorden.
— Tokonomix benchmark-samenvatting

Sectie 01

Kwaliteitsscores

Evaluatieresultaten van judge-model beoordelingen over diverse taakcategorieën. Scores weerspiegelen coherentie, accuratesse en instructieopvolging.

Creatief

Feitelijk

100

Meertaligheid

Redeneren

Sectie 02

Prijsgeschiedenis

Directe provider-tarieven per miljoen tokens, plus een typische gespreks-kostschatting.

💰

API-tarieven — gpt-5-search-api

$1.25 per 1M input-tokens

$10.00 per 1M output-tokens

≈ $0.0028 per typisch gesprek (800 tokens)

Input vs output prijs (per 1M tokens)

per 1M input-tokens$1.25

per 1M output-tokens$10.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.25

input / 1M

— stable

$10.00

output / 1M

— stable

2026-05-242026-06-212026-07-26

Input

Output

Price change

⟳ synced weekly

Sectie 03

Sterke & zwakke punten

Gebaseerd op benchmark-resultaten en geaggregeerde community-feedback over echte use-cases.

Sterke punten

Realtime webzoekopdrachtenActuele informatie beschikbaarBronvermeldingen bij antwoordenCombinatie van kennis en zoekdataSnelle zoek- en antwoordcyclusBrede webdekking bij queries

Zwakke punten

Meerkosten voor zoekfunctionaliteitIets hogere latentie door zoekopdrachtBeperkte toegang tot afgesloten bronnen

Sectie 04

Mogelijkheden

toolssource: litellmvisionjson modepdf inputjson schemaparallel toolsprompt cachingmax output tokens: 128000

Sectie 05

Veelgestelde vragen

gpt-5-search-api combineert taalmodelcapaciteiten met realtime webzoekopdrachten, waardoor antwoorden actuele informatie bevatten.

Ideaal wanneer actuele informatie en bronvermelding essentieel zijn voor de toepassing.
— Tokonomix benchmark-samenvatting

Sectie 06

Beschikbaarheid

Nog geen meetdata

Er zijn nog niet genoeg API-aanroepen geregistreerd om beschikbaarheidsstatistieken voor dit model te tonen. Data verschijnt zodra het model live verkeer ontvangt.

Sectie 07

Tokonomix benchmark-oordelen

⚖️

Endorsed by 2 judges

Independent LLM judges evaluated this model on our weekly intelligence tests

cohere/command-a100/100 · 1 runs

1 correct0 partial0 wrong100% accuracy

claude-sonnet-4-596/100 · 111 runs

105 correct3 partial3 wrong95% accuracy

● 2026-07-26

Quality drops sharply as factual performance degrades significantly

GPT-5-search-api experienced a substantial quality regression in this benchmark window, with overall scores declining from 97.7 to 80.3 points. The most dramatic shift occurred in factual accuracy, where the model scored just 25 points, suggesting severe degradation in its core search and retrieval capabilities. This decline is particularly concerning given the model's search-focused positioning. Latency also worsened considerably, increasing 75% from 4067ms to 7127ms at the median, which may impact user experience in time-sensitive applications. Despite these setbacks, the model maintained exceptional performance in several areas. Creative tasks scored 98 points, matching the previous window's performance. Multilingual capabilities improved from 95 to a perfect 100, indicating strengthened language handling. Reasoning tasks also performed well at 98 points, though this represents a new category without historical comparison. The contrast between near-perfect scores in creative, multilingual, and reasoning tasks versus the critical failure in factual performance suggests a significant issue with the model's information retrieval or accuracy systems. Users relying on this model for fact-based search queries should exercise caution and verification until these issues are addressed.

Quality

80.3

Latency p50

7,127 ms

Test runs

✗ Quality dropped 17.4 points✗ Factual accuracy severely degraded✗ Latency increased 75%✓ Multilingual reached perfect score

Sectie 08

Volledig modelprofiel

GPT-5 Search API: GPT-5 met ingebouwde webgrounding

GPT-5 Search API is de search-gegrounde variant van de GPT-5-lijn. Het model haalt eerst actuele webbronnen op voordat het een antwoord genereert, en synthetiseert de opgehaalde inhoud vervolgens tot een antwoord. Het verkoopargument is voor de hand liggend: in plaats van te fabriceren over gebeurtenissen na de post-training-cutoff, zoekt het model ze op. De afwegingen liggen even voor de hand, en ze bepalen waar dit endpoint daadwerkelijk past binnen een productie-stack.

Wat de search-wrapper wel en niet oplost

Het hallucinatieprobleem op de basis-GPT-5-lijn concentreert zich op twee plekken: nichetopics waar de trainingsdata dun is, en actuele gebeurtenissen voorbij de training-cutoff. Search grounding adresseert vooral het tweede, minder het eerste. Wanneer het model een recent artikel over een recente gebeurtenis ophaalt voordat het genereert, wordt het antwoord verankerd in echte tekst in plaats van in zelfverzekerde fabricatie.

Wat de wrapper niet oplost, is de kloof tussen retrieval en synthese. Het model moet nog steeds kiezen wát het ophaalt, beoordelen welke bronnen betrouwbaar zijn en synthetiseren over soms-tegenstrijdige bronnen heen. Elk van die stappen kan falen. Slechte retrieval queries leveren irrelevante bronnen op. Bronranking kan onbetrouwbare pagina's omhoog stuwen. Synthese kan correcte feiten uit één bron mengen met gehallucineerde context die ze aan elkaar lijmt.

Het praktische effect is dat Search API één klasse fouten (training-cutoff hallucinatie) inruilt voor een andere klasse (retrieval-en-synthese-falen). Of die ruil goed uitpakt, hangt af van de workload. Voor actualiteitsvragen is het antwoord meestal ja. Voor statische kennisvragen is het antwoord vaak nee — beter om een basismodel te bevragen en de cutoff te accepteren dan om retrieval-faalmodi te introduceren.

Waar Search API daadwerkelijk past

De duidelijke gevallen zijn vragen waarbij het antwoord afhangt van recente informatie. Nieuwsgerelateerde vragen. Actuele prijzen en beschikbaarheid. Recente softwarereleases. Recente regelgevingswijzigingen. Alles waarvan het juiste antwoord ten tijde van training niet kenbaar was.

Het tweede geval zijn vragen waarbij het antwoord bronvermelding vereist. Sommige downstream-applicaties moeten de gebruiker tonen waar informatie vandaan komt — fact-check workflows, journalistieke tools, onderzoeksassistenten. Search API kan citaties retourneren naast het gesynthetiseerde antwoord, wat de basis-GPT-5-lijn niet kan.

Het derde geval zijn vragen die baat hebben bij grounding, zelfs wanneer de onderliggende kennis in de trainingsdata zit. Het model vragen om het antwoord "op te zoeken" in plaats van te herinneren kan hallucinatie op nichetopics verminderen, omdat het model gedwongen wordt zijn generatie te verzoenen met opgehaalde tekst in plaats van uitsluitend te leunen op parametrisch geheugen.

Onder de motorkap

GPT-5 Search API is de GPT-5 transformer-decoder gekoppeld aan een search-en-retrieval-laag. Het retrievalsysteem bevraagt het web, rankt resultaten en levert de topbronnen als context aan het model, samen met de query van de gebruiker. Het model genereert vervolgens een antwoord dat de opgehaalde inhoud integreert.

Het model zelf is de GPT-5-generatie, met de standaard GPT-5 BPE-tokenisatie. Het contextvenster omvat zowel de prompt van de gebruiker als de opgehaalde inhoud, wat betekent dat opgehaalde bronnen een deel van het beschikbare budget verbruiken — voor queries die veel bronnen ophalen, is de ruimte van het model om te redeneren navenant kleiner.

OpenAI heeft de exacte retrieval-pijplijn, het ranking-algoritme of de criteria voor bronselectie niet gepubliceerd. Het retrievalsysteem maakt deel uit van de OpenAI-infrastructuur en is niet afzonderlijk configureerbaar.

Waar het vandaag staat

Voor actualiteitsvragen en workflows waarbij citaties vereist zijn, produceert het Search API-aanbod merkbaar betere antwoorden dan de basis-GPT-5-lijn. De retrieval verankert de generatie in echte bronnen.

Voor statische kennisvragen is de toegevoegde waarde kleiner en soms negatief. Het basis-GPT-5-model kent al het meeste van wat in goed gedocumenteerde bronnen staat, en de retrieval-stap kan fouten introduceren door slechte bronnen of foute rankingbeslissingen.

Het intelligence leaderboard volgt de vergelijkende positie; Search API zit in een aparte categorie omdat het workloadprofiel aanzienlijk verschilt van niet-gegrounde generatie.

Waar de grenzen liggen

Retrievalkwaliteit is de bottleneck. Het systeem haalt op wat het ophaalt; je controleert niet welke bronnen hoog worden gerankt. Pagina's met hoge SEO-scores kunnen autoritatievere bronnen voorbijstreven. Recente SEO-geoptimaliseerde AI-gegenereerde content verdringt soms originele berichtgeving.

Bronbetrouwbaarheid wordt niet altijd goed afgehandeld. Het model behandelt opgehaalde inhoud als input, wat betekent dat goed opgemaakte desinformatie even autoritair kan worden geciteerd als goed opgemaakte accurate content. Het model markeert niet altijd zorgen over bronbetrouwbaarheid.

Latency is hoger dan de niet-gegrounde basis. Elke query omvat retrieval plus generatie, en de retrieval-roundtrip voegt merkbare tijd toe. Voor interactieve workloads telt dit.

Kosten zijn hoger dan de niet-gegrounde basis. Je betaalt voor de retrieval-infrastructuur plus het grotere contextvenster dat opgehaalde bronnen omvat.

De retrieval-cutoff elimineert hallucinatie niet. Het model kan nog steeds fabriceren binnen de synthesestap, vooral wanneer de opgehaalde bronnen schaars of tegenstrijdig zijn.

Wanneer hiernaar grijpen

Gebruik Search API voor actualiteitsvragen waarbij het juiste antwoord afhangt van recente informatie die niet in de trainingsdata zit.

Gebruik het voor workflows die naast antwoorden bronnen moeten citeren — onderzoek, journalistiek, fact-checking.

Gebruik het voor vragen over nichetopics waarbij retrieval-gegrounde antwoorden doorgaans betrouwbaarder zijn dan parametrische recall, zelfs wanneer het onderwerp in de trainingsdata werd behandeld.

Voor content-workflows waarbij actueel nieuws of recente ontwikkelingen worden samengevat, is de grounding een reëel voordeel. Voor data-extractie waarbij de brondocumenten de eigen inputs van de gebruiker zijn in plaats van opgehaalde webinhoud, gebruik je in plaats daarvan de basis-GPT-5-lijn.

Wanneer het basismodel de juiste keuze is

Sla Search API over voor statische kennisvragen waarbij de trainingsdata volstaat en de retrieval-stap latency, kosten en foutoppervlak toevoegt zonder waarde toe te voegen.

Sla het over voor workflows waarbij je zelf de brondocumenten beheert — interne RAG-systemen met je eigen knowledge base. Bouw de retrieval-pijplijn zelf tegen het basismodel en je krijgt betere controle over bronselectie.

Sla het over voor latency-gevoelige interactieve applicaties waar de retrieval-roundtrip onacceptabel is.

Alternatieven

Voor workloads die search-gegrounde generatie nodig hebben met meer controle over de retrievallaag, geeft het zelf bouwen van een RAG-pijplijn tegen de basis-GPT-5-lijn je betere controle over bronselectie en ranking. De afweging is operationele overhead.

Voor workloads waarbij citatie-gegrounde generatie ertoe doet en je een andere provider wilt, bestaan vergelijkbare search-gegrounde aanbiedingen van andere frontier-providers met wisselende retrievalkwaliteit. Test op je specifieke queryverdeling.

Voor workloads die de training-cutoff op kennis kunnen verdragen, is de basis-GPT-5-lijn in de relevante generatie meestal goedkoper, sneller en voorspelbaarder.

Laatste technische review: 2026-05-22 — Tokonomix.ai

Laatste automatische test

26 jul 2026 · 05:37 UTC · Benchmark

P50 latency

3713 ms

P95 latency

—

Fouten

0 / 6 runs

Laatst beoordeeld door Tokonomix-team·26 mei 2026