Naar inhoud
Draait in:USGemaakt in:United States
OpenAI

gpt-4o-mini-search-preview-2025-03-11

Tokonomix-redactie·Gecontroleerd door Mes Kalkan··

gpt-4o-mini-search-preview-2025-03-11 is een variant van OpenAI's GPT-4o mini-model en vormt een kostenefficiënte optie binnen het taalmodellenaanbod van het bedrijf. Als onderdeel van de GPT-4o-familie bouwt het voort op OpenAI's multimodale architectuur, terwijl het geoptimaliseerd is voor scenario's waarbij lagere latentie en verminderde rekenlast prioriteit hebben. Deze preview-versie bevat zoekfunctionaliteit, wat duidt op integratie met externe informatieophaalcapaciteiten om antwoorden te verrijken met actuele of feitelijke gegevens buiten de trainingscutoff van het model. Het model is ontworpen voor standaard tekstgeneratietaken en ondersteunt toepassingen zoals conversatie-agents, contentcreatie, samenvatting en algemene vraagbeantwoording. De zoek-preview-aanduiding geeft aan dat deze variant zich in een test- of vroege-toegangsfase bevindt, waardoor ontwikkelaars kunnen experimenteren met zoek-ondersteunde generatiepatronen. Hoewel de exacte contextvenstergrootte niet publiekelijk is gespecificeerd, bieden modellen in de GPT-4o mini-familie doorgaans voldoende contextcapaciteit voor de meeste gangbare gebruikssituaties, terwijl ze snellere responstijden handhaven in vergelijking met grotere modellen in de GPT-4-serie. Binnen OpenAI's modelhiërarchie staat gpt-4o-mini-search-preview-2025-03-11 onder de volledige GPT-4o- en GPT-4-modellen wat betreft capaciteit en schaal, maar biedt het voordelen op het gebied van snelheid en efficiëntie. Het bedient gebruikers die betrouwbaar taalbegrip en -generatie nodig hebben zonder de meest geavanceerde redeneercapaciteiten van vlaggenschipmodellen te vereisen, met name in toepassingen waar realtime informatietoegang via zoekintegratie betekenisvolle waarde toevoegt.

gpt-4o-mini-search-preview-2025-03-11 combineert taalmodelkracht met realtime webzoekfuncties voor actuele antwoorden.

Tokonomix benchmark-samenvatting
Sectie 01

Kwaliteitsscores

Evaluatieresultaten van judge-model beoordelingen over diverse taakcategorieën. Scores weerspiegelen coherentie, accuratesse en instructieopvolging.

100
Code generatie
90
Meertaligheid
100
Redeneren
Sectie 02

Prijsgeschiedenis

Directe provider-tarieven per miljoen tokens, plus een typische gespreks-kostschatting.

💰
API-tarieven — gpt-4o-mini-search-preview-2025-03-11
$0.1500 per 1M input-tokens
$0.6000 per 1M output-tokens
≈ $0.0002 per typisch gesprek (800 tokens)
Input vs output prijs (per 1M tokens)
per 1M input-tokens$0.1500
per 1M output-tokens$0.6000

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.1500

input / 1M

— stable

$0.6000

output / 1M

— stable

2026-05-242026-06-142026-06-14
Input
Output
Price change
⟳ synced weekly
Sectie 03

Sterke & zwakke punten

Gebaseerd op benchmark-resultaten en geaggregeerde community-feedback over echte use-cases.

Sterke punten

Realtime webzoekopdrachtenActuele informatie beschikbaarBronvermeldingen bij antwoordenCombinatie van kennis en zoekdataSnelle zoek- en antwoordcyclusBrede webdekking bij queries

Zwakke punten

Meerkosten voor zoekfunctionaliteitIets hogere latentie door zoekopdrachtBeperkte toegang tot afgesloten bronnen
Sectie 04

Mogelijkheden

toolssource: litellmvisionjson modepdf inputjson schemaparallel toolsprompt cachingmax output tokens: 16384
Sectie 05

Veelgestelde vragen

gpt-4o-mini-search-preview-2025-03-11 combineert taalmodelcapaciteiten met realtime webzoekopdrachten, waardoor antwoorden actuele informatie bevatten.

Ideaal wanneer actuele informatie en bronvermelding essentieel zijn voor de toepassing.

Tokonomix benchmark-samenvatting
Sectie 06

Beschikbaarheid

Beschikbaarheid

Nog geen meetdata

Er zijn nog niet genoeg API-aanroepen geregistreerd om beschikbaarheidsstatistieken voor dit model te tonen. Data verschijnt zodra het model live verkeer ontvangt.

Sectie 07

Tokonomix benchmark-oordelen

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-592/100 · 75 runs
61 correct13 partial1 wrong81% accuracy
2026-06-14

Major capability expansion with tools and vision support added

This model version represents a significant evolution with the addition of multiple new capabilities including tools, vision, JSON mode, PDF input, JSON schema, parallel tools, and prompt caching. These additions transform the model from a text-only system into a multimodal platform with enhanced integration options. The expanded capability set enables developers to build more sophisticated applications with structured outputs, visual understanding, and efficient caching mechanisms. The introduction of tool calling and parallel tool execution particularly extends the model's utility for agentic workflows and complex task orchestration. Vision support adds multimodal understanding that was previously unavailable. JSON schema and JSON mode provide better control over structured outputs, while PDF input expands document processing capabilities. Prompt caching offers potential performance and cost optimizations for repeated queries. However, without performance metrics from the current benchmark window, it's unclear how these new features impact baseline text generation quality, latency, or accuracy. Users should evaluate whether the expanded capabilities meet their specific use cases while monitoring for any trade-offs in core text generation performance that may accompany this broader feature set.

Quality

Latency p50

Test runs

0

Tools and parallel execution added Vision capability now supported JSON schema and mode available Prompt caching enabled
Sectie 08

Volledig modelprofiel

gpt-4o-mini-search-preview-2025-03-11 — illustration 1
gpt-4o-mini-search-preview-2025-03-11: de maart mini-search pin

gpt-4o-mini-search-preview-2025-03-11 is de maart 2025 gedateerde snapshot van OpenAI's kleine search-augmented chatmodel. Dezelfde retrieval-tool architectuur als de doorlopende alias, bevroren op dat releasemoment zodat productie-implementaties kunnen vastpinnen op gekend gedrag.

Search-gegronde antwoorden zijn ongewoon gevoelig voor model-versie drift. Het vastpinnen van een snapshot is wat citatiegedrag, querystrategieën en synthesestijl voorspelbaar houdt terwijl OpenAI blijft itereren op de preview-lijn.

Wat deze snapshot vertegenwoordigt

Tegen maart 2025 had de mini-search preview:

  • Het citatieformaat voor metadata gestabiliseerd dat de doorlopende alias nog steeds gebruikt.
  • De factureringsstructuur per-search-call vastgelegd.
  • De meer disruptieve query-constructie regressies van de oorspronkelijke preview-drops opgelost.

Wat het niet heeft, ten opzichte van latere snapshots:

  • Het verbeterde query-herschrijven dat medio 2025 arriveerde en het aantal search-calls per antwoord verminderde.
  • De verfijningen aan citatierangschikking die gezaghebbende bronnen agressiever naar voren schoven.
  • De latentieverbeteringen uit backend-infrastructuurwijzigingen gedurende Q2 2025.

Voor implementaties die in het voorjaar van 2025 gevalideerd zijn, is dit hoogstwaarschijnlijk de snapshot waar de validatie tegenaan is getoetst.

Waarom de gedateerde pin meer uitmaakt voor search-modellen

Search-augmented chat heeft meerdere gedragsdimensies die tussen snapshots kunnen verschuiven, elk waarvan zichtbaar is in het product:

  • Het aantal search-calls per antwoord — verandert het latentieprofiel en de kosten per request.
  • De keuze welke bronnen te citeren — beïnvloedt de waargenomen autoriteit van het antwoord.
  • De synthesestijl voor het combineren van opgehaalde content met pre-trained kennis — beïnvloedt hoe het antwoord leest.
  • De drempelwaarde wanneer het model besluit überhaupt te zoeken versus antwoorden vanuit pre-training — beïnvloedt de dekking van versheid.

Een snapshot-pin bevriest dit alles op zijn plek. Meegaan met de alias betekent accepteren dat elk ervan kan verschuiven op de dag dat OpenAI een nieuwe revisie uitbrengt.

De migratievraag

Dezelfde vorm als elke gedateerde snapshot-pin.

  • Houd de maart-pin in productie terwijl je evalueert.
  • Voer opnieuw een representatieve set queries uit tegen de kandidaat nieuwere snapshot.
  • Vergelijk op citatiekwaliteit, search-call efficiëntie, latentie en synthesestijl naast pure antwoordnauwkeurigheid.
  • Migreer wanneer de nieuwere snapshot aantoonbaar wint op de dimensies die ertoe doen voor jouw product.

Het argument voor migratie van een stabiele pin is zelden "de nieuwe is gemiddeld beter." Het argument is "de nieuwe is beter op de specifieke dingen waar mijn product op gebouwd is." Wees eerlijk over in welk geval je werkelijk zit.

Waar het tekortschiet

Zwaar redeneren over opgehaalde content. Mini is het kleine model. De volledige search preview is de juiste escalatie wanneer synthese het knelpunt wordt.

Domein-private kennis. De search-tool indexeert publieke webcontent. Interne documentatie heeft een aparte RAG-pipeline nodig.

Latentie-kritisch interactief gebruik. Search voegt round-trips toe. Mini-search is sneller dan de volledige search preview maar nog steeds langzamer dan puur gegenereerde antwoorden.

Self-hosted deployment. De search-tool vereist OpenAI's backend-infrastructuur. Het /usecases/local overzicht behandelt wat beschikbaar is wanneer on-premises beperkingen gelden.

Wanneer precies deze snapshot vastpinnen

Kies gpt-4o-mini-search-preview-2025-03-11 wanneer:

  • Je een search-gegronde functie hebt uitgebracht op het maart 2025 mini-search gedrag en het stabiel moet houden.
  • Citatiegedrag en bronselectie deel uitmaakten van wat jouw voorjaar 2025 evaluatie heeft doorstaan.
  • Een A/B-test of onderzoeksprotocol een vaste search-model referentie nodig heeft over maanden heen.

Sla het over wanneer:

  • Je helemaal opnieuw begint — pin in plaats daarvan de meest recente snapshot.
  • Het query-herschrijven of de latentieverbeteringen in latere snapshots hebben gewonnen in jouw evaluatie.
  • De uiteindelijke stabiele release van de search-augmented lijn beschikbaar is — dat is het juiste doelwit voor nieuwe projecten.

Deployment-opmerkingen

Standaard Chat Completions API. De search-tool wordt automatisch aangeroepen door het model op basis van de prompt; het API-oppervlak is onveranderd ten opzichte van non-search modellen met toevoeging van gestructureerde citatiemetadata in het antwoord.

Token-facturering splitst tekst in, tekst uit en per-search-call kosten. De per-search-call kosten zijn onveranderd over mini-search snapshots tot nu toe, hoewel de frequentie waarmee het model searches triggert kan variëren tussen snapshots en daarmee ook de effectieve kosten per conversatie.

Het citatiemetadata-formaat is stabiel over deze snapshot en latere 2025 snapshots heen, wat de UI-renderingcode herbruikbaar houdt over migraties heen.

De pragmatische lezing. Dit is de maart 2025 bevriezing van mini-search. Pin het wanneer jouw product ertegen gevalideerd was. Migreer wanneer jouw eigen evaluatie zegt dat de nieuwere snapshot de juiste keuze is op de dimensies die ertoe doen. Voer query-niveau vergelijkingen uit bij /live-test voordat je committeert.

Laatste technische review: 2026-05-22 — Tokonomix.ai

gpt-4o-mini-search-preview-2025-03-11 — illustration 2
Laatste automatische test
14 jun 2026 · 04:58 UTC · Benchmark
P50 latency
4627 ms
P95 latency
Fouten
0 / 6 runs
Laatst beoordeeld door Tokonomix-team·26 mei 2026