Ir al contenido
Se ejecuta en:USCreado en:United States
OpenAI

gpt-4o-mini-search-preview-2025-03-11

Equipo editorial Tokonomix·Revisado por Mes Kalkan··

gpt-4o-mini-search-preview-2025-03-11 es una variante del modelo GPT-4o mini de OpenAI, que representa una opción económicamente eficiente en la línea de modelos de lenguaje de la empresa. Como parte de la familia GPT-4o, se construye sobre la arquitectura multimodal de OpenAI mientras está optimizado para escenarios donde la baja latencia y la reducción de sobrecarga computacional son prioridades. Esta versión preview incluye funcionalidad de búsqueda, sugiriendo integración con capacidades de recuperación de información externa para mejorar las respuestas con datos actuales o fácticos más allá de la fecha límite de entrenamiento del modelo. El modelo está diseñado para tareas estándar de generación de texto, soportando aplicaciones como agentes conversacionales, creación de contenido, resumen y respuestas a preguntas de propósito general. La designación search preview indica que esta variante está en una fase de prueba o acceso temprano, permitiendo a los desarrolladores experimentar con patrones de generación aumentada por búsqueda. Aunque el tamaño exacto de la ventana de contexto no se ha especificado públicamente, los modelos en la familia GPT-4o mini típicamente ofrecen capacidad de contexto suficiente para la mayoría de casos de uso comunes mientras mantienen tiempos de respuesta más rápidos comparados con modelos más grandes en la serie GPT-4. Dentro de la jerarquía de modelos de OpenAI, gpt-4o-mini-search-preview-2025-03-11 se sitúa por debajo de los modelos completos GPT-4o y GPT-4 en términos de capacidad y escala, pero ofrece ventajas en velocidad y eficiencia. Sirve a usuarios que necesitan comprensión y generación de lenguaje confiables sin requerir las capacidades de razonamiento más avanzadas de los modelos insignia, particularmente en aplicaciones donde el acceso a información en tiempo real a través de integración de búsqueda proporciona valor significativo.

GPT-4o Mini Search Preview integra búsqueda web en tiempo real con la eficiencia del modelo mini, ofreciendo respuestas actualizadas a menor costo.

Resumen de benchmark Tokonomix
Sección 01

Puntuaciones de calidad

Resultados de evaluación de modelos juez en diversas categorías de tareas. Las puntuaciones reflejan coherencia, precisión y seguimiento de instrucciones.

100
Generación de código
90
Multilingüe
100
Razonamiento
Sección 02

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰
Tarifas API — gpt-4o-mini-search-preview-2025-03-11
$0.1500 por 1M de tokens de entrada
$0.6000 por 1M de tokens de salida
≈ $0.0002 por conversación típica (800 tokens)
Precio entrada vs salida (por 1M de tokens)
por 1M de tokens de entrada$0.1500
por 1M de tokens de salida$0.6000

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.1500

input / 1M

— stable

$0.6000

output / 1M

— stable

2026-05-242026-06-142026-06-14
Input
Output
Price change
⟳ synced weekly
Sección 03

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Búsqueda web integrada en tiempo realMenor costo que search estándarInformación actualizada más allá del corteVelocidad del modelo miniFact-checking con fuentes actualesÚtil para consultas sobre eventos recientes

Debilidades

Preview: capacidades en evoluciónRazonamiento limitado por ser miniCalidad de búsqueda puede variarContexto no documentado para esta versión
Sección 04

Capacidades

toolssource: litellmvisionjson modepdf inputjson schemaparallel toolsprompt cachingmax output tokens: 16384
Sección 05

Preguntas frecuentes

El modelo recupera información de la web durante la inferencia para complementar su conocimiento de entrenamiento con datos actuales.

La combinación de búsqueda web y modelo eficiente resuelve el problema del conocimiento desactualizado en aplicaciones de bajo presupuesto.

Resumen de benchmark Tokonomix
Sección 06

Disponibilidad

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 07

Veredictos del benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-592/100 · 75 runs
61 correct13 partial1 wrong81% accuracy
2026-06-14

Major capability expansion with tools and vision support added

This model version represents a significant evolution with the addition of multiple new capabilities including tools, vision, JSON mode, PDF input, JSON schema, parallel tools, and prompt caching. These additions transform the model from a text-only system into a multimodal platform with enhanced integration options. The expanded capability set enables developers to build more sophisticated applications with structured outputs, visual understanding, and efficient caching mechanisms. The introduction of tool calling and parallel tool execution particularly extends the model's utility for agentic workflows and complex task orchestration. Vision support adds multimodal understanding that was previously unavailable. JSON schema and JSON mode provide better control over structured outputs, while PDF input expands document processing capabilities. Prompt caching offers potential performance and cost optimizations for repeated queries. However, without performance metrics from the current benchmark window, it's unclear how these new features impact baseline text generation quality, latency, or accuracy. Users should evaluate whether the expanded capabilities meet their specific use cases while monitoring for any trade-offs in core text generation performance that may accompany this broader feature set.

Quality

Latency p50

Test runs

0

Tools and parallel execution added Vision capability now supported JSON schema and mode available Prompt caching enabled
Sección 08

Perfil completo del modelo

gpt-4o-mini-search-preview-2025-03-11 — illustration 1
gpt-4o-mini-search-preview-2025-03-11: la instantánea mini-search de marzo

gpt-4o-mini-search-preview-2025-03-11 es la instantánea fechada de marzo de 2025 del modelo pequeño de chat con búsqueda aumentada de OpenAI. Misma arquitectura de herramienta de recuperación que el alias móvil, congelada en ese punto de lanzamiento para que los despliegues en producción puedan fijar contra un comportamiento conocido.

Las respuestas fundamentadas en búsqueda son inusualmente sensibles a la deriva de versión del modelo. Fijar una instantánea es lo que mantiene predecible el comportamiento de citación, las estrategias de consulta y el estilo de síntesis mientras OpenAI continúa iterando sobre la línea preview.

Qué representa esta instantánea

Para marzo de 2025, la mini-search preview había:

  • Estabilizado el formato de metadatos de citación que el alias móvil todavía utiliza.
  • Consolidado la estructura de facturación por llamada de búsqueda.
  • Resuelto las regresiones más disruptivas en la construcción de consultas de las primeras versiones preview.

Lo que no tiene, en relación con instantáneas posteriores:

  • La reescritura de consultas mejorada que llegó a mediados de 2025 y redujo el número de llamadas de búsqueda por respuesta.
  • Los refinamientos en el ranking de citaciones que promovieron fuentes autoritativas de manera más agresiva.
  • Las mejoras de latencia provenientes de cambios de infraestructura backend durante el segundo trimestre de 2025.

Para despliegues validados en primavera de 2025, esta es muy probablemente la instantánea contra la cual pasó la validación.

Por qué la fijación fechada importa más para modelos de búsqueda

El chat con búsqueda aumentada tiene múltiples dimensiones comportamentales que pueden cambiar entre instantáneas, cada una de las cuales es visible en el producto:

  • El número de llamadas de búsqueda por respuesta — cambia el perfil de latencia y el coste por solicitud.
  • La elección de qué fuentes citar — afecta la autoridad percibida de la respuesta.
  • El estilo de síntesis para combinar contenido recuperado con conocimiento pre-entrenado — afecta cómo se lee la respuesta.
  • El umbral para cuando el modelo decide buscar en absoluto versus responder desde el pre-entrenamiento — afecta la cobertura de actualidad.

Una fijación de instantánea congela todas estas en su lugar. Rodar con el alias significa aceptar que cualquiera de ellas puede cambiar el día que OpenAI lance una nueva revisión.

La cuestión de la migración

Misma forma que cualquier fijación de instantánea fechada.

  • Mantén la fijación de marzo en producción mientras evalúas.
  • Vuelve a ejecutar un conjunto representativo de consultas contra la instantánea candidata más nueva.
  • Compara en calidad de citación, eficiencia de llamadas de búsqueda, latencia y estilo de síntesis junto con la precisión bruta de la respuesta.
  • Migra cuando la instantánea más nueva gane de manera demostrable en las dimensiones que importan para tu producto.

El caso para migrar desde una fijación estable rara vez es "la nueva es mejor en promedio". El caso es "la nueva es mejor en las cosas específicas sobre las que mi producto está construido". Sé honesto sobre en qué caso estás realmente.

Dónde falla

Razonamiento intenso sobre contenido recuperado. Mini es el modelo pequeño. La search preview completa es la escalada correcta cuando la síntesis se convierte en el cuello de botella.

Conocimiento privado de dominio. La herramienta de búsqueda indexa contenido web público. Los documentos internos necesitan un pipeline RAG separado.

Uso interactivo crítico en latencia. La búsqueda añade viajes de ida y vuelta. Mini-search es más rápida que la search preview completa pero todavía más lenta que las respuestas puramente generadas.

Despliegue auto-hospedado. La herramienta de búsqueda requiere la infraestructura backend de OpenAI. La revisión de /usecases/local cubre qué está disponible cuando las restricciones on-premises vinculan.

Cuándo fijar esta instantánea exacta

Elige gpt-4o-mini-search-preview-2025-03-11 cuando:

  • Lanzaste una funcionalidad fundamentada en búsqueda sobre el comportamiento de mini-search de marzo de 2025 y necesitas mantenerla estable.
  • El comportamiento de citación y la selección de fuentes fueron parte de lo que pasó tu evaluación de primavera de 2025.
  • Una prueba A/B o protocolo de investigación necesita una referencia de modelo de búsqueda fija a lo largo de meses.

Omítela cuando:

  • Estás empezando desde cero — fija la instantánea más reciente en su lugar.
  • Las mejoras de reescritura de consultas o latencia en instantáneas posteriores han ganado en tu evaluación.
  • El lanzamiento estable eventual de la línea con búsqueda aumentada está disponible — ese es el objetivo correcto para proyectos nuevos.

Notas de despliegue

API estándar de Chat Completions. La herramienta de búsqueda es invocada automáticamente por el modelo basándose en el prompt; la superficie de la API no cambia respecto a modelos sin búsqueda con la adición de metadatos de citación estructurados en la respuesta.

La facturación de tokens divide texto de entrada, texto de salida y tarifas por llamada de búsqueda. La tarifa por llamada de búsqueda no ha cambiado entre instantáneas mini-search hasta ahora, aunque la tasa a la que el modelo activa búsquedas puede variar entre instantáneas y por lo tanto también puede hacerlo el coste efectivo por conversación.

El formato de metadatos de citación es estable a través de esta instantánea y las instantáneas posteriores de 2025, lo que mantiene el código de renderizado de UI reutilizable a través de migraciones.

La lectura pragmática. Esta es la congelación de marzo de 2025 de mini-search. Fíjala cuando tu producto fue validado contra ella. Migra cuando tu propia evaluación diga que la instantánea más nueva es el movimiento correcto en las dimensiones que importan. Ejecuta comparaciones a nivel de consulta en /live-test antes de comprometerte.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

gpt-4o-mini-search-preview-2025-03-11 — illustration 2
Última prueba automática
14 jun 2026 · 04:58 UTC · Benchmark
Latencia P50
4627 ms
Latencia P95
Errores
0 / 6 ejecuciones
Última revisión por Equipo Tokonomix·26 de mayo de 2026