Für welche Aufgaben ist Such-Augmentation besonders nützlich?

Aktuelle Nachrichten, Fakten-Checks, Recherche und Fragen über aktuelle Ereignisse.

Ist das Modell für einfache Chatbots geeignet?

Als mini-Variante eignet es sich für moderate Komplexität; die Such-Funktion ist ein Bonus für informationsreiche Anfragen.

Ist das Modell produktionsreif?

Preview-Status bedeutet, dass es für Tests gedacht ist; GA-Tauglichkeit muss noch bestätigt werden.

Tier C — Spezialist

Läuft in:USErstellt in:United States

Archiviert

Dieses Modell wurde vom Anbieter eingestellt. Historische Daten bleiben erhalten.

Seit 26. Juli 2026 nicht mehr verfügbar.

OpenAI

gpt-4o-mini-search-preview-2025-03-11

Tier C — Spezialist

Tokonomix-Redaktionsteam·Geprüft von Mes Kalkan·Veröffentlicht 22. Mai 2026·Zuletzt geprüft 26. Mai 2026

gpt-4o-mini-search-preview-2025-03-11 ist eine Variante von OpenAIs GPT-4o mini-Modell und stellt eine kosteneffiziente Option in der Sprachmodell-Produktpalette des Unternehmens dar. Als Teil der GPT-4o-Familie baut es auf OpenAIs multimodaler Architektur auf und ist für Szenarien optimiert, in denen niedrige Latenz und reduzierter Rechenaufwand Priorität haben. Diese Preview-Version umfasst Suchfunktionalität, was auf eine Integration mit externen Informationsabruf-Fähigkeiten hindeutet, um Antworten mit aktuellen oder faktischen Daten über den Trainingszeitpunkt des Modells hinaus zu erweitern. Das Modell ist für standardmäßige Textgenerierungsaufgaben konzipiert und unterstützt Anwendungen wie Konversationsagenten, Content-Erstellung, Zusammenfassungen und allgemeine Frage-Antwort-Systeme. Die Bezeichnung „Search Preview" deutet darauf hin, dass sich diese Variante in einer Test- oder Early-Access-Phase befindet und Entwicklern ermöglicht, mit suchgestützten Generierungsmustern zu experimentieren. Obwohl die genaue Kontextfenstergröße nicht öffentlich spezifiziert wurde, bieten Modelle der GPT-4o mini-Familie typischerweise ausreichende Kontextkapazität für die meisten gängigen Anwendungsfälle bei gleichzeitig schnelleren Antwortzeiten im Vergleich zu größeren Modellen der GPT-4-Serie. Innerhalb von OpenAIs Modellhierarchie steht gpt-4o-mini-search-preview-2025-03-11 hinsichtlich Leistungsfähigkeit und Umfang unter den vollständigen GPT-4o- und GPT-4-Modellen, bietet jedoch Vorteile in Geschwindigkeit und Effizienz. Es dient Nutzern, die zuverlässiges Sprachverständnis und Generierung benötigen, ohne die fortgeschrittensten Reasoning-Fähigkeiten der Flaggschiff-Modelle zu erfordern – insbesondere in Anwendungen, wo Echtzeit-Informationszugriff durch Suchintegration einen bedeutenden Mehrwert bietet.

GPT-4o-mini-search-preview ergänzt das Sprachmodell mit Websuche für aktuelle, faktenbasierte Antworten.
— Tokonomix-Benchmark-Zusammenfassung

Abschnitt 01

Preisverlauf

Direkte Provider-Tarife pro Million Tokens, plus eine typische Gesprächskostenschätzung.

💰

API-Tarife — gpt-4o-mini-search-preview-2025-03-11

$0.1500 pro 1M Input-Tokens

$0.6000 pro 1M Output-Tokens

≈ $0.0002 pro typischem Gespräch (800 Tokens)

Input- vs. Output-Preis (pro 1M Tokens)

pro 1M Input-Tokens$0.1500

pro 1M Output-Tokens$0.6000

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.1500

input / 1M

— stable

$0.6000

output / 1M

— stable

2026-05-242026-06-282026-07-26

Input

Output

Price change

⟳ synced weekly

Abschnitt 02

Stärken & Schwächen

Basierend auf Benchmark-Ergebnissen und aggregiertem Community-Feedback zu realen Anwendungsfällen.

Stärken

Integrierte Websuche für aktuelle DatenAktuelle Ereignisse und FaktenEffizienz der mini-ArchitekturAllgemeine SprachgenerierungOpenAI-API-IntegrationSuch-erweiterte Antwortqualität

Schwächen

Preview-Status – nicht GAWeniger Tiefe als Full-GPT-4oKontextgröße nicht spezifiziert

Abschnitt 03

Fähigkeiten

toolssource: litellmvisionjson modepdf inputjson schemaparallel toolsprompt cachingmax output tokens: 16384

Abschnitt 04

Häufig gestellte Fragen

Es kann aktuelle Webinformationen abrufen, um Antworten mit Daten jenseits des Trainings-Cutoffs zu bereichern.

Wenn aktuelle Informationen wichtig sind, schließt die Such-Integration die Lücke zwischen Trainingsdaten und Gegenwart.
— Tokonomix-Benchmark-Zusammenfassung

Abschnitt 05

Verfügbarkeit

Noch keine Messdaten

Es wurden noch nicht genug API-Aufrufe aufgezeichnet, um Verfügbarkeitsstatistiken für dieses Modell anzuzeigen. Daten erscheinen, sobald das Modell Live-Traffic erhält.

Abschnitt 06

Tokonomix-Benchmark-Urteile

⚖️

Endorsed by 1 judge

Independent LLM judges evaluated this model on our weekly intelligence tests

claude-sonnet-4-591/100 · 105 runs

84 correct17 partial4 wrong80% accuracy

● 2026-07-26

No benchmark data available; extensive tool capabilities added

This model iteration adds substantial capability expansion without accompanying benchmark performance data. The addition of tools, vision, JSON mode, PDF input, JSON schema support, parallel tools, and prompt caching represents a significant technical evolution from previous versions that lacked these features. However, the absence of benchmark results across all standard evaluation metrics makes it impossible to assess actual performance characteristics or compare against other models in the class. Users should note that while the feature set suggests this is a full-capability model variant, there is no empirical evidence of its performance on reasoning tasks, knowledge retrieval, coding challenges, or instruction following. The search-preview designation in the model name suggests integration with search capabilities, though this cannot be verified through available data. For production deployments, teams should conduct internal evaluations since public benchmarks provide no guidance on expected performance levels. The comprehensive tooling support indicates suitability for agentic workflows and structured output scenarios, but actual effectiveness remains unvalidated by standardized testing.

Quality

—

Latency p50

—

Test runs

✓ Tool capabilities added✓ Vision and PDF support enabled✓ Prompt caching now available✗ No benchmark data published

Abschnitt 07

Vollständiges Modellprofil

gpt-4o-mini-search-preview-2025-03-11: der März-Mini-Search-Pin

gpt-4o-mini-search-preview-2025-03-11 ist der datierte Snapshot des kleinen, suchgestützten Chat-Modells von OpenAI vom März 2025. Identische Retrieval-Tool-Architektur wie der rollende Alias, eingefroren auf diesem Release-Stand, damit Produktionsdeployments gegen bekanntes Verhalten gepinnt werden können.

Suchgestützte Antworten reagieren ungewöhnlich empfindlich auf Modellversions-Drift. Das Pinnen eines Snapshots ist das, was Zitierverhalten, Query-Strategien und Synthese-Stil vorhersehbar hält, während OpenAI an der Preview-Linie weiterarbeitet.

Was dieser Snapshot repräsentiert

Bis März 2025 hatte die Mini-Search-Preview:

Das Format der Zitations-Metadaten stabilisiert, das der rollende Alias bis heute verwendet.
Die Abrechnungsstruktur pro Suchaufruf festgelegt.
Die disruptiveren Query-Konstruktions-Regressionen der ursprünglichen Preview-Drops behoben.

Was er im Vergleich zu späteren Snapshots nicht hat:

Das verbesserte Query-Rewriting, das Mitte 2025 eingeführt wurde und die Anzahl der Suchaufrufe pro Antwort reduzierte.
Die Verfeinerungen des Citation-Rankings, die autoritative Quellen aggressiver hervorheben.
Die Latenzverbesserungen durch Backend-Infrastruktur-Änderungen im Verlauf des zweiten Quartals 2025.

Für im Frühjahr 2025 validierte Deployments ist das höchstwahrscheinlich der Snapshot, gegen den die Validierung bestanden wurde.

Warum der datierte Pin für Suchmodelle wichtiger ist

Suchgestützter Chat hat mehrere Verhaltensdimensionen, die sich zwischen Snapshots verschieben können, und jede davon ist im Produkt sichtbar:

Die Anzahl der Suchaufrufe pro Antwort — verändert das Latenzprofil und die Kosten pro Anfrage.
Die Wahl der zu zitierenden Quellen — beeinflusst die wahrgenommene Autorität der Antwort.
Der Synthese-Stil zur Kombination abgerufener Inhalte mit vortrainiertem Wissen — beeinflusst, wie die Antwort sich liest.
Die Schwelle, ab der das Modell überhaupt zu suchen entscheidet, statt aus dem Pre-Training zu antworten — beeinflusst die Aktualitätsabdeckung.

Ein Snapshot-Pin friert all das ein. Mit dem Alias zu rollen bedeutet zu akzeptieren, dass sich jede dieser Dimensionen an dem Tag verschieben kann, an dem OpenAI eine neue Revision ausliefert.

Die Migrationsfrage

Gleiche Form wie bei jedem datierten Snapshot-Pin.

Halten Sie den März-Pin in Produktion, während Sie evaluieren.
Fahren Sie eine repräsentative Menge an Queries erneut gegen den neueren Kandidaten-Snapshot.
Vergleichen Sie hinsichtlich Zitationsqualität, Sucheffizienz, Latenz und Synthese-Stil neben der reinen Antwortgenauigkeit.
Migrieren Sie, wenn der neuere Snapshot in den für Ihr Produkt relevanten Dimensionen nachweisbar gewinnt.

Das Argument, von einem stabilen Pin wegzumigrieren, lautet selten „der neue ist im Durchschnitt besser". Das Argument lautet „der neue ist besser bei den spezifischen Dingen, um die mein Produkt aufgebaut ist." Seien Sie ehrlich, in welchem Fall Sie sich tatsächlich befinden.

Wo es nicht passt

Schweres Reasoning über abgerufene Inhalte. Mini ist das kleine Modell. Die vollständige Search-Preview ist die richtige Eskalation, wenn die Synthese zum Engpass wird.

Domänenprivates Wissen. Das Such-Tool indexiert öffentliche Webinhalte. Interne Dokumente benötigen eine separate RAG-Pipeline.

Latenzkritische interaktive Nutzung. Suche fügt Round-Trips hinzu. Mini-Search ist schneller als die vollständige Search-Preview, aber immer noch langsamer als rein generierte Antworten.

Self-Hosted-Deployment. Das Such-Tool benötigt OpenAIs Backend-Infrastruktur. Die Übersicht unter /usecases/local behandelt, was verfügbar ist, wenn On-Prem-Anforderungen greifen.

Wann genau dieser Snapshot zu pinnen ist

Wählen Sie gpt-4o-mini-search-preview-2025-03-11, wenn:

Sie ein suchgestütztes Feature auf Basis des Mini-Search-Verhaltens vom März 2025 ausgeliefert haben und es stabil halten müssen.
Zitierverhalten und Quellenauswahl Teil dessen waren, was Ihre Evaluation im Frühjahr 2025 bestanden hat.
Ein A/B-Test oder Forschungsprotokoll eine feste Such-Modell-Referenz über Monate hinweg benötigt.

Überspringen Sie ihn, wenn:

Sie neu anfangen — pinnen Sie stattdessen den aktuellsten Snapshot.
Die Query-Rewriting- oder Latenzverbesserungen in späteren Snapshots in Ihrer Evaluation gewonnen haben.
Das eventuelle stabile Release der suchgestützten Linie verfügbar ist — das ist das richtige Ziel für neue Projekte.

Deployment-Hinweise

Standard-Chat-Completions-API. Das Such-Tool wird vom Modell automatisch anhand des Prompts aufgerufen; die API-Oberfläche ist gegenüber Nicht-Such-Modellen unverändert, ergänzt um strukturierte Zitations-Metadaten in der Response.

Die Token-Abrechnung teilt sich in Text-Eingabe, Text-Ausgabe und Gebühren pro Suchaufruf. Die Gebühr pro Suchaufruf ist über die bisherigen Mini-Search-Snapshots hinweg unverändert, allerdings kann die Rate, mit der das Modell Suchen auslöst, zwischen Snapshots variieren — und damit auch die effektiven Kosten pro Konversation.

Das Format der Zitations-Metadaten ist über diesen Snapshot und spätere 2025er-Snapshots hinweg stabil, was den UI-Rendering-Code über Migrationen hinweg wiederverwendbar hält.

Die pragmatische Lesart. Dies ist der Einfrierpunkt von Mini-Search vom März 2025. Pinnen Sie ihn, wenn Ihr Produkt dagegen validiert wurde. Migrieren Sie, wenn Ihre eigene Evaluation sagt, dass der neuere Snapshot in den relevanten Dimensionen der richtige Schritt ist. Führen Sie Query-Level-Vergleiche unter /live-test durch, bevor Sie sich festlegen.

Letzte technische Prüfung: 2026-05-22 — Tokonomix.ai

Letzter automatisierter Test

26. Juli 2026 · 05:30 UTC · Benchmark

P50-Latenz

—

P95-Latenz

—

Fehler

1 / 6 Läufe

Zuletzt geprüft von Tokonomix-Team·26. Mai 2026