Worden alle bronnen vermeld?

Ja, het model citeert doorgaans de webpagina's die zijn gebruikt voor het samenstellen van het antwoord.

Is het model geschikt voor feitenchecking?

Het model kan helpen bij feitenchecking via realtime zoekresultaten, maar kritische verificatie blijft de verantwoordelijkheid van de gebruiker.

Hoe actueel zijn de zoekresultaten?

Zoekresultaten zijn in principe actueel op het moment van de query, afhankelijk van de indexatiesnelheid van de gebruikte zoekmachine.

Tier C — Specialist

Draait in:USGemaakt in:United States

Gearchiveerd

Dit model is door de aanbieder uit productie genomen. Historische data blijft bewaard.

Niet meer beschikbaar sinds 26 juli 2026.

OpenAI

gpt-4o-mini-search-preview-2025-03-11

Tier C — Specialist

Tokonomix-redactie·Gecontroleerd door Mes Kalkan·Gepubliceerd 22 mei 2026·Laatst gecontroleerd 26 mei 2026

gpt-4o-mini-search-preview-2025-03-11 is een variant van OpenAI's GPT-4o mini-model en vormt een kostenefficiënte optie binnen het taalmodellenaanbod van het bedrijf. Als onderdeel van de GPT-4o-familie bouwt het voort op OpenAI's multimodale architectuur, terwijl het geoptimaliseerd is voor scenario's waarbij lagere latentie en verminderde rekenlast prioriteit hebben. Deze preview-versie bevat zoekfunctionaliteit, wat duidt op integratie met externe informatieophaalcapaciteiten om antwoorden te verrijken met actuele of feitelijke gegevens buiten de trainingscutoff van het model. Het model is ontworpen voor standaard tekstgeneratietaken en ondersteunt toepassingen zoals conversatie-agents, contentcreatie, samenvatting en algemene vraagbeantwoording. De zoek-preview-aanduiding geeft aan dat deze variant zich in een test- of vroege-toegangsfase bevindt, waardoor ontwikkelaars kunnen experimenteren met zoek-ondersteunde generatiepatronen. Hoewel de exacte contextvenstergrootte niet publiekelijk is gespecificeerd, bieden modellen in de GPT-4o mini-familie doorgaans voldoende contextcapaciteit voor de meeste gangbare gebruikssituaties, terwijl ze snellere responstijden handhaven in vergelijking met grotere modellen in de GPT-4-serie. Binnen OpenAI's modelhiërarchie staat gpt-4o-mini-search-preview-2025-03-11 onder de volledige GPT-4o- en GPT-4-modellen wat betreft capaciteit en schaal, maar biedt het voordelen op het gebied van snelheid en efficiëntie. Het bedient gebruikers die betrouwbaar taalbegrip en -generatie nodig hebben zonder de meest geavanceerde redeneercapaciteiten van vlaggenschipmodellen te vereisen, met name in toepassingen waar realtime informatietoegang via zoekintegratie betekenisvolle waarde toevoegt.

gpt-4o-mini-search-preview-2025-03-11 combineert taalmodelkracht met realtime webzoekfuncties voor actuele antwoorden.
— Tokonomix benchmark-samenvatting

Sectie 01

Prijsgeschiedenis

Directe provider-tarieven per miljoen tokens, plus een typische gespreks-kostschatting.

💰

API-tarieven — gpt-4o-mini-search-preview-2025-03-11

$0.1500 per 1M input-tokens

$0.6000 per 1M output-tokens

≈ $0.0002 per typisch gesprek (800 tokens)

Input vs output prijs (per 1M tokens)

per 1M input-tokens$0.1500

per 1M output-tokens$0.6000

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.1500

input / 1M

— stable

$0.6000

output / 1M

— stable

2026-05-242026-06-282026-07-26

Input

Output

Price change

⟳ synced weekly

Sectie 02

Sterke & zwakke punten

Gebaseerd op benchmark-resultaten en geaggregeerde community-feedback over echte use-cases.

Sterke punten

Realtime webzoekopdrachtenActuele informatie beschikbaarBronvermeldingen bij antwoordenCombinatie van kennis en zoekdataSnelle zoek- en antwoordcyclusBrede webdekking bij queries

Zwakke punten

Meerkosten voor zoekfunctionaliteitIets hogere latentie door zoekopdrachtBeperkte toegang tot afgesloten bronnen

Sectie 03

Mogelijkheden

toolssource: litellmvisionjson modepdf inputjson schemaparallel toolsprompt cachingmax output tokens: 16384

Sectie 04

Veelgestelde vragen

gpt-4o-mini-search-preview-2025-03-11 combineert taalmodelcapaciteiten met realtime webzoekopdrachten, waardoor antwoorden actuele informatie bevatten.

Ideaal wanneer actuele informatie en bronvermelding essentieel zijn voor de toepassing.
— Tokonomix benchmark-samenvatting

Sectie 05

Beschikbaarheid

Nog geen meetdata

Er zijn nog niet genoeg API-aanroepen geregistreerd om beschikbaarheidsstatistieken voor dit model te tonen. Data verschijnt zodra het model live verkeer ontvangt.

Sectie 06

Tokonomix benchmark-oordelen

⚖️

Endorsed by 1 judge

Independent LLM judges evaluated this model on our weekly intelligence tests

claude-sonnet-4-591/100 · 105 runs

84 correct17 partial4 wrong80% accuracy

● 2026-07-26

No benchmark data available; extensive tool capabilities added

This model iteration adds substantial capability expansion without accompanying benchmark performance data. The addition of tools, vision, JSON mode, PDF input, JSON schema support, parallel tools, and prompt caching represents a significant technical evolution from previous versions that lacked these features. However, the absence of benchmark results across all standard evaluation metrics makes it impossible to assess actual performance characteristics or compare against other models in the class. Users should note that while the feature set suggests this is a full-capability model variant, there is no empirical evidence of its performance on reasoning tasks, knowledge retrieval, coding challenges, or instruction following. The search-preview designation in the model name suggests integration with search capabilities, though this cannot be verified through available data. For production deployments, teams should conduct internal evaluations since public benchmarks provide no guidance on expected performance levels. The comprehensive tooling support indicates suitability for agentic workflows and structured output scenarios, but actual effectiveness remains unvalidated by standardized testing.

Quality

—

Latency p50

—

Test runs

✓ Tool capabilities added✓ Vision and PDF support enabled✓ Prompt caching now available✗ No benchmark data published

Sectie 07

Volledig modelprofiel

gpt-4o-mini-search-preview-2025-03-11: de maart mini-search pin

gpt-4o-mini-search-preview-2025-03-11 is de maart 2025 gedateerde snapshot van OpenAI's kleine search-augmented chatmodel. Dezelfde retrieval-tool architectuur als de doorlopende alias, bevroren op dat releasemoment zodat productie-implementaties kunnen vastpinnen op gekend gedrag.

Search-gegronde antwoorden zijn ongewoon gevoelig voor model-versie drift. Het vastpinnen van een snapshot is wat citatiegedrag, querystrategieën en synthesestijl voorspelbaar houdt terwijl OpenAI blijft itereren op de preview-lijn.

Wat deze snapshot vertegenwoordigt

Tegen maart 2025 had de mini-search preview:

Het citatieformaat voor metadata gestabiliseerd dat de doorlopende alias nog steeds gebruikt.
De factureringsstructuur per-search-call vastgelegd.
De meer disruptieve query-constructie regressies van de oorspronkelijke preview-drops opgelost.

Wat het niet heeft, ten opzichte van latere snapshots:

Het verbeterde query-herschrijven dat medio 2025 arriveerde en het aantal search-calls per antwoord verminderde.
De verfijningen aan citatierangschikking die gezaghebbende bronnen agressiever naar voren schoven.
De latentieverbeteringen uit backend-infrastructuurwijzigingen gedurende Q2 2025.

Voor implementaties die in het voorjaar van 2025 gevalideerd zijn, is dit hoogstwaarschijnlijk de snapshot waar de validatie tegenaan is getoetst.

Waarom de gedateerde pin meer uitmaakt voor search-modellen

Search-augmented chat heeft meerdere gedragsdimensies die tussen snapshots kunnen verschuiven, elk waarvan zichtbaar is in het product:

Het aantal search-calls per antwoord — verandert het latentieprofiel en de kosten per request.
De keuze welke bronnen te citeren — beïnvloedt de waargenomen autoriteit van het antwoord.
De synthesestijl voor het combineren van opgehaalde content met pre-trained kennis — beïnvloedt hoe het antwoord leest.
De drempelwaarde wanneer het model besluit überhaupt te zoeken versus antwoorden vanuit pre-training — beïnvloedt de dekking van versheid.

Een snapshot-pin bevriest dit alles op zijn plek. Meegaan met de alias betekent accepteren dat elk ervan kan verschuiven op de dag dat OpenAI een nieuwe revisie uitbrengt.

De migratievraag

Dezelfde vorm als elke gedateerde snapshot-pin.

Houd de maart-pin in productie terwijl je evalueert.
Voer opnieuw een representatieve set queries uit tegen de kandidaat nieuwere snapshot.
Vergelijk op citatiekwaliteit, search-call efficiëntie, latentie en synthesestijl naast pure antwoordnauwkeurigheid.
Migreer wanneer de nieuwere snapshot aantoonbaar wint op de dimensies die ertoe doen voor jouw product.

Het argument voor migratie van een stabiele pin is zelden "de nieuwe is gemiddeld beter." Het argument is "de nieuwe is beter op de specifieke dingen waar mijn product op gebouwd is." Wees eerlijk over in welk geval je werkelijk zit.

Waar het tekortschiet

Zwaar redeneren over opgehaalde content. Mini is het kleine model. De volledige search preview is de juiste escalatie wanneer synthese het knelpunt wordt.

Domein-private kennis. De search-tool indexeert publieke webcontent. Interne documentatie heeft een aparte RAG-pipeline nodig.

Latentie-kritisch interactief gebruik. Search voegt round-trips toe. Mini-search is sneller dan de volledige search preview maar nog steeds langzamer dan puur gegenereerde antwoorden.

Self-hosted deployment. De search-tool vereist OpenAI's backend-infrastructuur. Het /usecases/local overzicht behandelt wat beschikbaar is wanneer on-premises beperkingen gelden.

Wanneer precies deze snapshot vastpinnen

Kies gpt-4o-mini-search-preview-2025-03-11 wanneer:

Je een search-gegronde functie hebt uitgebracht op het maart 2025 mini-search gedrag en het stabiel moet houden.
Citatiegedrag en bronselectie deel uitmaakten van wat jouw voorjaar 2025 evaluatie heeft doorstaan.
Een A/B-test of onderzoeksprotocol een vaste search-model referentie nodig heeft over maanden heen.

Sla het over wanneer:

Je helemaal opnieuw begint — pin in plaats daarvan de meest recente snapshot.
Het query-herschrijven of de latentieverbeteringen in latere snapshots hebben gewonnen in jouw evaluatie.
De uiteindelijke stabiele release van de search-augmented lijn beschikbaar is — dat is het juiste doelwit voor nieuwe projecten.

Deployment-opmerkingen

Standaard Chat Completions API. De search-tool wordt automatisch aangeroepen door het model op basis van de prompt; het API-oppervlak is onveranderd ten opzichte van non-search modellen met toevoeging van gestructureerde citatiemetadata in het antwoord.

Token-facturering splitst tekst in, tekst uit en per-search-call kosten. De per-search-call kosten zijn onveranderd over mini-search snapshots tot nu toe, hoewel de frequentie waarmee het model searches triggert kan variëren tussen snapshots en daarmee ook de effectieve kosten per conversatie.

Het citatiemetadata-formaat is stabiel over deze snapshot en latere 2025 snapshots heen, wat de UI-renderingcode herbruikbaar houdt over migraties heen.

De pragmatische lezing. Dit is de maart 2025 bevriezing van mini-search. Pin het wanneer jouw product ertegen gevalideerd was. Migreer wanneer jouw eigen evaluatie zegt dat de nieuwere snapshot de juiste keuze is op de dimensies die ertoe doen. Voer query-niveau vergelijkingen uit bij /live-test voordat je committeert.

Laatste technische review: 2026-05-22 — Tokonomix.ai

Laatste automatische test

26 jul 2026 · 05:30 UTC · Benchmark

P50 latency

—

P95 latency

—

Fouten

1 / 6 runs

Laatst beoordeeld door Tokonomix-team·26 mei 2026