
gpt-4o-mini-search-preview-2025-03-11 ist der datierte Snapshot des kleinen, suchgestützten Chat-Modells von OpenAI vom März 2025. Identische Retrieval-Tool-Architektur wie der rollende Alias, eingefroren auf diesem Release-Stand, damit Produktionsdeployments gegen bekanntes Verhalten gepinnt werden können.
Suchgestützte Antworten reagieren ungewöhnlich empfindlich auf Modellversions-Drift. Das Pinnen eines Snapshots ist das, was Zitierverhalten, Query-Strategien und Synthese-Stil vorhersehbar hält, während OpenAI an der Preview-Linie weiterarbeitet.
Was dieser Snapshot repräsentiert
Bis März 2025 hatte die Mini-Search-Preview:
- Das Format der Zitations-Metadaten stabilisiert, das der rollende Alias bis heute verwendet.
- Die Abrechnungsstruktur pro Suchaufruf festgelegt.
- Die disruptiveren Query-Konstruktions-Regressionen der ursprünglichen Preview-Drops behoben.
Was er im Vergleich zu späteren Snapshots nicht hat:
- Das verbesserte Query-Rewriting, das Mitte 2025 eingeführt wurde und die Anzahl der Suchaufrufe pro Antwort reduzierte.
- Die Verfeinerungen des Citation-Rankings, die autoritative Quellen aggressiver hervorheben.
- Die Latenzverbesserungen durch Backend-Infrastruktur-Änderungen im Verlauf des zweiten Quartals 2025.
Für im Frühjahr 2025 validierte Deployments ist das höchstwahrscheinlich der Snapshot, gegen den die Validierung bestanden wurde.
Warum der datierte Pin für Suchmodelle wichtiger ist
Suchgestützter Chat hat mehrere Verhaltensdimensionen, die sich zwischen Snapshots verschieben können, und jede davon ist im Produkt sichtbar:
- Die Anzahl der Suchaufrufe pro Antwort — verändert das Latenzprofil und die Kosten pro Anfrage.
- Die Wahl der zu zitierenden Quellen — beeinflusst die wahrgenommene Autorität der Antwort.
- Der Synthese-Stil zur Kombination abgerufener Inhalte mit vortrainiertem Wissen — beeinflusst, wie die Antwort sich liest.
- Die Schwelle, ab der das Modell überhaupt zu suchen entscheidet, statt aus dem Pre-Training zu antworten — beeinflusst die Aktualitätsabdeckung.
Ein Snapshot-Pin friert all das ein. Mit dem Alias zu rollen bedeutet zu akzeptieren, dass sich jede dieser Dimensionen an dem Tag verschieben kann, an dem OpenAI eine neue Revision ausliefert.
Die Migrationsfrage
Gleiche Form wie bei jedem datierten Snapshot-Pin.
- Halten Sie den März-Pin in Produktion, während Sie evaluieren.
- Fahren Sie eine repräsentative Menge an Queries erneut gegen den neueren Kandidaten-Snapshot.
- Vergleichen Sie hinsichtlich Zitationsqualität, Sucheffizienz, Latenz und Synthese-Stil neben der reinen Antwortgenauigkeit.
- Migrieren Sie, wenn der neuere Snapshot in den für Ihr Produkt relevanten Dimensionen nachweisbar gewinnt.
Das Argument, von einem stabilen Pin wegzumigrieren, lautet selten „der neue ist im Durchschnitt besser". Das Argument lautet „der neue ist besser bei den spezifischen Dingen, um die mein Produkt aufgebaut ist." Seien Sie ehrlich, in welchem Fall Sie sich tatsächlich befinden.
Wo es nicht passt
Schweres Reasoning über abgerufene Inhalte. Mini ist das kleine Modell. Die vollständige Search-Preview ist die richtige Eskalation, wenn die Synthese zum Engpass wird.
Domänenprivates Wissen. Das Such-Tool indexiert öffentliche Webinhalte. Interne Dokumente benötigen eine separate RAG-Pipeline.
Latenzkritische interaktive Nutzung. Suche fügt Round-Trips hinzu. Mini-Search ist schneller als die vollständige Search-Preview, aber immer noch langsamer als rein generierte Antworten.
Self-Hosted-Deployment. Das Such-Tool benötigt OpenAIs Backend-Infrastruktur. Die Übersicht unter /usecases/local behandelt, was verfügbar ist, wenn On-Prem-Anforderungen greifen.
Wann genau dieser Snapshot zu pinnen ist
Wählen Sie gpt-4o-mini-search-preview-2025-03-11, wenn:
- Sie ein suchgestütztes Feature auf Basis des Mini-Search-Verhaltens vom März 2025 ausgeliefert haben und es stabil halten müssen.
- Zitierverhalten und Quellenauswahl Teil dessen waren, was Ihre Evaluation im Frühjahr 2025 bestanden hat.
- Ein A/B-Test oder Forschungsprotokoll eine feste Such-Modell-Referenz über Monate hinweg benötigt.
Überspringen Sie ihn, wenn:
- Sie neu anfangen — pinnen Sie stattdessen den aktuellsten Snapshot.
- Die Query-Rewriting- oder Latenzverbesserungen in späteren Snapshots in Ihrer Evaluation gewonnen haben.
- Das eventuelle stabile Release der suchgestützten Linie verfügbar ist — das ist das richtige Ziel für neue Projekte.
Deployment-Hinweise
Standard-Chat-Completions-API. Das Such-Tool wird vom Modell automatisch anhand des Prompts aufgerufen; die API-Oberfläche ist gegenüber Nicht-Such-Modellen unverändert, ergänzt um strukturierte Zitations-Metadaten in der Response.
Die Token-Abrechnung teilt sich in Text-Eingabe, Text-Ausgabe und Gebühren pro Suchaufruf. Die Gebühr pro Suchaufruf ist über die bisherigen Mini-Search-Snapshots hinweg unverändert, allerdings kann die Rate, mit der das Modell Suchen auslöst, zwischen Snapshots variieren — und damit auch die effektiven Kosten pro Konversation.
Das Format der Zitations-Metadaten ist über diesen Snapshot und spätere 2025er-Snapshots hinweg stabil, was den UI-Rendering-Code über Migrationen hinweg wiederverwendbar hält.
Die pragmatische Lesart. Dies ist der Einfrierpunkt von Mini-Search vom März 2025. Pinnen Sie ihn, wenn Ihr Produkt dagegen validiert wurde. Migrieren Sie, wenn Ihre eigene Evaluation sagt, dass der neuere Snapshot in den relevanten Dimensionen der richtige Schritt ist. Führen Sie Query-Level-Vergleiche unter /live-test durch, bevor Sie sich festlegen.
Letzte technische Prüfung: 2026-05-22 — Tokonomix.ai
