Ir al contenido
Tier C — Especialista
Se ejecuta en:USCreado en:United States
OpenAI

gpt-4o-mini-search-preview

Tier C — Especialista

Equipo editorial Tokonomix·Revisado por Mes Kalkan··

GPT-4o Mini Search Preview es un modelo de lenguaje compacto desarrollado por OpenAI que combina capacidades estándar de generación de texto con funcionalidades experimentales mejoradas por búsqueda. Este modelo representa una variante en la serie GPT-4o Mini de OpenAI, diseñada para explorar la integración entre la comprensión del lenguaje y las funcionalidades de recuperación de información. Procesa entradas en lenguaje natural y genera salidas basadas en texto mientras prueba mecanismos para fundamentar respuestas en fuentes de información externas. El modelo mantiene las características arquitectónicas centrales de la familia GPT-4o Mini, ofreciendo generación de texto en diversas tareas incluyendo conversación, creación de contenido, resumen y respuesta a preguntas. Como lanzamiento "preview", sirve como terreno de pruebas para enfoques de generación aumentada por búsqueda, permitiendo a los desarrolladores experimentar con modelos que potencialmente pueden referenciar e incorporar información en tiempo real o externa. El tamaño de la ventana de contexto no ha sido especificado públicamente, aunque probablemente se alinea con las configuraciones estándar en las ofertas de modelos compactos de OpenAI. Dentro de la línea de modelos de OpenAI, GPT-4o Mini Search Preview ocupa una posición como variante experimental del modelo base GPT-4o Mini. Se sitúa por debajo de los modelos completos GPT-4o y GPT-4 en términos de recursos computacionales y alcance de capacidades, mientras ofrece una opción más accesible para aplicaciones donde la menor latencia y los requisitos reducidos de recursos son prioridades. La designación "preview" indica que este es un lanzamiento de desarrollo destinado a pruebas tempranas en lugar de despliegue en producción a escala.

GPT-4o Mini Search Preview combina las virtudes de eficiencia de los modelos compactos con capacidades experimentales de búsqueda aumentada, posicionándose como una opción explorativa para desarrolladores que necesitan respuestas fundamentadas en información externa.

Análisis editorial Tokonomix
Sección 01

Puntuaciones de calidad

Resultados de evaluación de modelos juez en diversas categorías de tareas. Las puntuaciones reflejan coherencia, precisión y seguimiento de instrucciones.

100
Generación de código
99
Multilingüe
100
Razonamiento
Sección 02

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰
Tarifas API — gpt-4o-mini-search-preview
$0.1500 por 1M de tokens de entrada
$0.6000 por 1M de tokens de salida
≈ $0.0002 por conversación típica (800 tokens)
Precio entrada vs salida (por 1M de tokens)
por 1M de tokens de entrada$0.1500
por 1M de tokens de salida$0.6000

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.1500

input / 1M

— stable

$0.6000

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Sección 03

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Generación aumentada con búsqueda experimentalLatencia reducida comparado con GPT-4o completoRecursos computacionales accesiblesFundamento de respuestas en fuentes externasPlataforma de prueba para nuevas funcionalidadesConversación y Q&A con contexto ampliadoGeneración de contenido estándar mantenidaIdeal para prototipado rápido

Debilidades

Estado preview implica inestabilidad potencialVentana de contexto no especificada públicamenteCapacidades inferiores a modelos GPT-4 completosComportamiento de búsqueda aún experimental
Sección 04

Capacidades

toolssource: litellmvisionjson modepdf inputjson schemaparallel toolsprompt cachingmax output tokens: 16384
Sección 05

Preguntas frecuentes

Incorpora funcionalidades experimentales de búsqueda que permiten fundamentar respuestas en información externa, mientras que el modelo estándar opera exclusivamente con su conocimiento pre-entrenado. Esta variante está diseñada específicamente para probar enfoques de generación aumentada por recuperación.

Una herramienta valiosa para equipos que desean experimentar con generación aumentada por búsqueda sin el costo computacional de modelos más grandes, aunque su estado preview exige precaución en implementaciones de producción.

Evaluación técnica Tokonomix
Sección 06

Disponibilidad

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 07

Veredictos del benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-591/100 · 76 runs
64 correct9 partial3 wrong84% accuracy
2026-06-14

Search-focused variant adds multimodal inputs, awaits benchmarks

The gpt-4o-mini-search-preview represents a specialized variant of GPT-4o Mini, introducing significant capability expansions while benchmark performance data remains unavailable. This release adds comprehensive tool support including function calling with both single and parallel execution modes, vision capabilities for image processing, PDF input handling, and structured output options through JSON mode and JSON schema compliance. The model also implements prompt caching for efficiency gains in repetitive queries. These additions position the model as a multimodal solution rather than text-only, with the search designation suggesting optimization for information retrieval tasks. However, without current benchmark window results across standard evaluation metrics, users cannot yet assess how these new capabilities impact core performance dimensions like reasoning accuracy, response quality, or latency characteristics. The gap between capability announcement and performance validation means early adopters should conduct domain-specific testing. Organizations considering this model should weigh the value of expanded input modalities and structured output options against the uncertainty in benchmark-validated performance, particularly if migrating from models with established metrics.

Quality

Latency p50

Test runs

0

Vision and PDF support added Tool calling with parallel execution Structured JSON output modes No benchmark data available
Sección 08

Perfil completo del modelo

gpt-4o-mini-search-preview — illustration 1
gpt-4o-mini-search-preview: chat con búsqueda aumentada de nivel pequeño

gpt-4o-mini-search-preview es el modelo de chat con búsqueda aumentada de nivel pequeño de OpenAI. El modelo tiene acceso a una herramienta de búsqueda backend que recupera contenido web actualizado, integra citas, y devuelve respuestas fundamentadas en fuentes recuperadas en lugar de depender puramente del conocimiento de pre-entrenamiento. El tamaño mini mantiene el coste por solicitud lo suficientemente bajo como para colocar respuestas fundamentadas en búsquedas detrás de funcionalidades de alto volumen.

Esto sigue etiquetado como preview. La línea en su conjunto todavía está en flujo. Fije la variante con fecha para mantener estabilidad de comportamiento.

Qué problema resuelve el chat con búsqueda aumentada

El límite del conocimiento pre-entrenado de un LLM estándar es un muro duro para muchos casos de uso prácticos. El modelo no conoce eventos posteriores a su fecha de corte de entrenamiento. El modelo no conoce el comunicado de prensa reciente de tu cliente. El modelo no conoce el cambio regulatorio que entró en vigor la semana pasada.

El chat con búsqueda aumentada coloca una herramienta de recuperación dentro del bucle de razonamiento del modelo. El modelo decide cuándo buscar, ejecuta la consulta, ingiere el contenido recuperado, y lo incorpora a la respuesta con citas en línea. Desde la perspectiva del llamador es una llamada API; detrás de escena el modelo está haciendo recuperación en vivo como parte de la respuesta.

Lo que esto te aporta, cuando funciona:

  • Respuestas fundamentadas en información actual en lugar de puntos de corte de pre-entrenamiento.
  • Citas que permiten al usuario verificar lo que el modelo está afirmando.
  • Una ruta de recuperación que no requiere que construyas y mantengas tu propia infraestructura RAG para contenido web general.

Mini-search es la variante apropiada de nivel de coste para aplicaciones de alto volumen. El gpt-4o-search-preview completo es la elección correcta cuando el razonamiento sobre contenido recuperado importa más que el coste por solicitud.

Dónde mini-search encaja bien

Cargas de trabajo que le vienen bien.

Interfaces conversacionales que necesitan verificaciones de actualización ocasionales en lugar de investigación continua. Asistentes de atención al cliente que necesitan consultar información de producto actual. Herramientas de conocimiento interno que aumentan RAG privado con contexto de web pública.

Superficies de preguntas y respuestas de alto volumen donde el coste de ejecutar cada consulta a través de un modelo completo con búsqueda fundamentada no sobreviviría a la economía unitaria. El perfil de coste de mini es lo que hace factibles las respuestas fundamentadas en búsquedas a escala.

Aplicaciones donde las citas son una característica en lugar de algo agradable de tener. Mini-search devuelve metadatos de citas estructurados que te permiten renderizar enlaces de fuentes en la interfaz sin scraping separado.

Dónde falla

Razonamiento pesado sobre el contenido recuperado. Mini es el modelo pequeño. Si la tarea es sintetizar documentos técnicos largos en un análisis de varios párrafos, la preview de búsqueda completa sale adelante. Si la tarea se adentra aún más en territorio de investigación, los modelos de línea de investigación en /benchmarks/methodology son el siguiente paso correcto.

Conocimiento privado del dominio. La herramienta de búsqueda indexa la web pública. Mini-search no encontrará tus documentos internos, los datos CRM de tu cliente, o tu base de conocimiento privada. Para ese trabajo todavía necesitas tu propia pipeline RAG.

Uso interactivo sensible a latencia. La búsqueda añade viajes de ida y vuelta. Incluso con el nivel mini, las respuestas con búsqueda aumentada son más lentas que las respuestas puramente generadas. Para interfaces donde la velocidad de escritura importa, sopesa el coste de latencia contra el beneficio de actualización.

Contratos estables. Etiquetado como preview. Fija la instantánea con fecha si tu producto no puede tolerar deriva de comportamiento.

Cuándo recurrir a él

Elige gpt-4o-mini-search-preview cuando:

  • Necesitas respuestas fundamentadas en búsquedas a alto volumen y el perfil de coste de la preview de búsqueda completa no encaja.
  • La carga de razonamiento sobre contenido recuperado es moderada — resumen, extracción de hechos, integración conversacional de información actualizada.
  • Las citas en línea son un requisito de producto en lugar de una característica extra.

Omítelo cuando:

  • La síntesis pesada sobre documentos recuperados es la tarea real — escala a la preview de búsqueda completa o a un modelo de línea de investigación.
  • El conocimiento que necesitas es privado — construye una pipeline RAG específica del dominio en su lugar.
  • La latencia importa más que la actualización — usa un modelo sin búsqueda y acepta la desactualización.
  • El despliegue requiere operación auto-alojada o con air-gap — ver /usecases/local.

Alternativas que vale la pena considerar

El gpt-4o-search-preview completo cuando el razonamiento sobre contenido recuperado es el diferenciador. Modelos de chat estándar sin búsqueda cuando la actualización en realidad no es requerida. Los modelos de línea de investigación de OpenAI y proveedores competidores para tareas de síntesis de formato largo. La encuesta más amplia de modelos de recuperación en /usecases/data-extraction cubre cargas de trabajo de extracción estructurada donde mini-search tiene la forma equivocada.

Notas de despliegue

Superficie API estándar de Chat Completions. La herramienta de búsqueda es invocada automáticamente por el modelo basándose en el prompt; no la pasas como definición de herramienta en la solicitud. Los metadatos de citas se devuelven en un campo estructurado junto con la salida de texto del modelo.

La facturación de tokens se divide en texto de entrada, texto de salida, y una tarifa por llamada de búsqueda. La tarifa por llamada es la nueva partida significativa frente a modelos de chat estándar. La planificación de capacidad necesita tener en cuenta el multiplicador que las invocaciones de búsqueda añaden a los costes de texto base.

La lectura pragmática. Mini-search es el modelo correcto cuando las respuestas fundamentadas en búsquedas necesitan estar disponibles a alto volumen y de forma económica. Es el modelo equivocado cuando el razonamiento sobre contenido recuperado es el verdadero diferenciador, o cuando el conocimiento que necesitas es privado en lugar de web pública. Pruébalo contra tus consultas reales en /live-test.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

gpt-4o-mini-search-preview — illustration 2gpt-4o-mini-search-preview — illustration 3
Última prueba automática
14 jun 2026 · 05:00 UTC · Benchmark
Latencia P50
3388 ms
Latencia P95
Errores
0 / 6 ejecuciones
Última revisión por Equipo Tokonomix·26 de mayo de 2026