
gpt-4o-mini-search-preview-2025-03-11 is de maart 2025 gedateerde snapshot van OpenAI's kleine search-augmented chatmodel. Dezelfde retrieval-tool architectuur als de doorlopende alias, bevroren op dat releasemoment zodat productie-implementaties kunnen vastpinnen op gekend gedrag.
Search-gegronde antwoorden zijn ongewoon gevoelig voor model-versie drift. Het vastpinnen van een snapshot is wat citatiegedrag, querystrategieën en synthesestijl voorspelbaar houdt terwijl OpenAI blijft itereren op de preview-lijn.
Wat deze snapshot vertegenwoordigt
Tegen maart 2025 had de mini-search preview:
- Het citatieformaat voor metadata gestabiliseerd dat de doorlopende alias nog steeds gebruikt.
- De factureringsstructuur per-search-call vastgelegd.
- De meer disruptieve query-constructie regressies van de oorspronkelijke preview-drops opgelost.
Wat het niet heeft, ten opzichte van latere snapshots:
- Het verbeterde query-herschrijven dat medio 2025 arriveerde en het aantal search-calls per antwoord verminderde.
- De verfijningen aan citatierangschikking die gezaghebbende bronnen agressiever naar voren schoven.
- De latentieverbeteringen uit backend-infrastructuurwijzigingen gedurende Q2 2025.
Voor implementaties die in het voorjaar van 2025 gevalideerd zijn, is dit hoogstwaarschijnlijk de snapshot waar de validatie tegenaan is getoetst.
Waarom de gedateerde pin meer uitmaakt voor search-modellen
Search-augmented chat heeft meerdere gedragsdimensies die tussen snapshots kunnen verschuiven, elk waarvan zichtbaar is in het product:
- Het aantal search-calls per antwoord — verandert het latentieprofiel en de kosten per request.
- De keuze welke bronnen te citeren — beïnvloedt de waargenomen autoriteit van het antwoord.
- De synthesestijl voor het combineren van opgehaalde content met pre-trained kennis — beïnvloedt hoe het antwoord leest.
- De drempelwaarde wanneer het model besluit überhaupt te zoeken versus antwoorden vanuit pre-training — beïnvloedt de dekking van versheid.
Een snapshot-pin bevriest dit alles op zijn plek. Meegaan met de alias betekent accepteren dat elk ervan kan verschuiven op de dag dat OpenAI een nieuwe revisie uitbrengt.
De migratievraag
Dezelfde vorm als elke gedateerde snapshot-pin.
- Houd de maart-pin in productie terwijl je evalueert.
- Voer opnieuw een representatieve set queries uit tegen de kandidaat nieuwere snapshot.
- Vergelijk op citatiekwaliteit, search-call efficiëntie, latentie en synthesestijl naast pure antwoordnauwkeurigheid.
- Migreer wanneer de nieuwere snapshot aantoonbaar wint op de dimensies die ertoe doen voor jouw product.
Het argument voor migratie van een stabiele pin is zelden "de nieuwe is gemiddeld beter." Het argument is "de nieuwe is beter op de specifieke dingen waar mijn product op gebouwd is." Wees eerlijk over in welk geval je werkelijk zit.
Waar het tekortschiet
Zwaar redeneren over opgehaalde content. Mini is het kleine model. De volledige search preview is de juiste escalatie wanneer synthese het knelpunt wordt.
Domein-private kennis. De search-tool indexeert publieke webcontent. Interne documentatie heeft een aparte RAG-pipeline nodig.
Latentie-kritisch interactief gebruik. Search voegt round-trips toe. Mini-search is sneller dan de volledige search preview maar nog steeds langzamer dan puur gegenereerde antwoorden.
Self-hosted deployment. De search-tool vereist OpenAI's backend-infrastructuur. Het /usecases/local overzicht behandelt wat beschikbaar is wanneer on-premises beperkingen gelden.
Wanneer precies deze snapshot vastpinnen
Kies gpt-4o-mini-search-preview-2025-03-11 wanneer:
- Je een search-gegronde functie hebt uitgebracht op het maart 2025 mini-search gedrag en het stabiel moet houden.
- Citatiegedrag en bronselectie deel uitmaakten van wat jouw voorjaar 2025 evaluatie heeft doorstaan.
- Een A/B-test of onderzoeksprotocol een vaste search-model referentie nodig heeft over maanden heen.
Sla het over wanneer:
- Je helemaal opnieuw begint — pin in plaats daarvan de meest recente snapshot.
- Het query-herschrijven of de latentieverbeteringen in latere snapshots hebben gewonnen in jouw evaluatie.
- De uiteindelijke stabiele release van de search-augmented lijn beschikbaar is — dat is het juiste doelwit voor nieuwe projecten.
Deployment-opmerkingen
Standaard Chat Completions API. De search-tool wordt automatisch aangeroepen door het model op basis van de prompt; het API-oppervlak is onveranderd ten opzichte van non-search modellen met toevoeging van gestructureerde citatiemetadata in het antwoord.
Token-facturering splitst tekst in, tekst uit en per-search-call kosten. De per-search-call kosten zijn onveranderd over mini-search snapshots tot nu toe, hoewel de frequentie waarmee het model searches triggert kan variëren tussen snapshots en daarmee ook de effectieve kosten per conversatie.
Het citatiemetadata-formaat is stabiel over deze snapshot en latere 2025 snapshots heen, wat de UI-renderingcode herbruikbaar houdt over migraties heen.
De pragmatische lezing. Dit is de maart 2025 bevriezing van mini-search. Pin het wanneer jouw product ertegen gevalideerd was. Migreer wanneer jouw eigen evaluatie zegt dat de nieuwere snapshot de juiste keuze is op de dimensies die ertoe doen. Voer query-niveau vergelijkingen uit bij /live-test voordat je committeert.
Laatste technische review: 2026-05-22 — Tokonomix.ai
