Ir al contenido
Se ejecuta en:USCreado en:United States
OpenAI

gpt-4o-search-preview-2025-03-11

Equipo editorial Tokonomix·Revisado por Mes Kalkan··

GPT-4o-search-preview-2025-03-11 es una variante de la familia de modelos GPT-4o de OpenAI que integra capacidades de búsqueda con funcionalidad de modelo de lenguaje grande. Este modelo está diseñado para combinar la comprensión y generación de lenguaje natural con la capacidad de recuperar e incorporar información actual de búsquedas web, permitiéndole proporcionar respuestas que reflejan eventos y datos recientes más allá de su fecha límite de entrenamiento. Representa un enfoque experimental para abordar las limitaciones de actualidad del conocimiento inherentes a los modelos de lenguaje estáticos. El modelo mantiene las características arquitectónicas centrales de la serie GPT-4o, incluyendo capacidades de comprensión multimodal, aunque su característica distintiva principal es la funcionalidad de búsqueda integrada que le permite aumentar las respuestas generadas con información recuperada. El tamaño de la ventana de contexto para esta variante particular no ha sido especificado públicamente por OpenAI. Es capaz de realizar tareas estándar de generación de texto incluyendo análisis, resumen, escritura creativa y resolución de problemas técnicos, con la dimensión adicional de poder referenciar información contemporánea cuando sea apropiado. Dentro de la línea de modelos de OpenAI, GPT-4o-search-preview-2025-03-11 ocupa una posición experimental, sirviendo como un lanzamiento preliminar que demuestra la integración de generación aumentada por recuperación en la arquitectura GPT-4o. La designación "preview" indica que esta es una versión de desarrollo destinada a recopilar retroalimentación y evaluar el rendimiento antes de un posible despliegue más amplio. Se sitúa junto a otras variantes de GPT-4o que se enfocan en diferentes objetivos de optimización como velocidad, eficiencia de costos o capacidades de razonamiento especializadas.

GPT-4o-search-preview representa el primer intento de OpenAI de fusionar su modelo insignia con capacidades de búsqueda en tiempo real, abriendo la puerta a respuestas fundamentadas en información actualizada sin depender de reentrenamiento constante.

Análisis editorial de Tokonomix
Sección 01

Puntuaciones de calidad

Resultados de evaluación de modelos juez en diversas categorías de tareas. Las puntuaciones reflejan coherencia, precisión y seguimiento de instrucciones.

100
Generación de código
99
Multilingüe
100
Razonamiento
Sección 02

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰
Tarifas API — gpt-4o-search-preview-2025-03-11
$2.50 por 1M de tokens de entrada
$10.00 por 1M de tokens de salida
≈ $0.0035 por conversación típica (800 tokens)
Precio entrada vs salida (por 1M de tokens)
por 1M de tokens de entrada$2.50
por 1M de tokens de salida$10.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.50

input / 1M

— stable

$10.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Sección 03

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Búsqueda web integrada nativamenteAcceso a información actualizada y recienteRazonamiento GPT-4o con datos contemporáneosGeneración aumentada por recuperaciónSupera limitaciones de corte de entrenamientoRespuestas contextualizadas con fuentes actualesCombina comprensión multimodal con búsquedaIdeal para análisis de eventos recientes

Debilidades

Estado experimental y vista previaEspecificaciones técnicas no divulgadasVentana de contexto sin confirmar públicamenteLatencia potencialmente mayor por búsquedas
Sección 04

Capacidades

toolssource: litellmvisionjson modepdf inputjson schemaparallel toolsprompt cachingmax output tokens: 16384
Sección 05

Preguntas frecuentes

Integra capacidades de búsqueda web directamente en el flujo de generación, permitiendo que el modelo acceda y cite información actualizada más allá de su fecha de corte de entrenamiento. Esto lo hace especialmente útil para consultas que requieren datos recientes o eventos actuales.

Para equipos que necesitan combinar razonamiento avanzado con acceso a información contemporánea, esta vista previa ofrece un vistazo prometedor al futuro de los modelos aumentados por recuperación, aunque su estado experimental requiere precaución en implementaciones críticas.

Resumen de Tokonomix
Sección 06

Disponibilidad

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 07

Veredictos del benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-592/100 · 76 runs
64 correct9 partial3 wrong84% accuracy
2026-06-14

Search-optimized variant maintains core capabilities without new additions

The gpt-4o-search-preview-2025-03-11 model represents a specialized variant of GPT-4o designed for search and retrieval tasks. This benchmark window shows stability in the model's existing capabilities, with no new features added since the previous evaluation period. The model continues to support the comprehensive toolset established earlier, including vision processing, structured output via JSON mode and JSON schema, PDF input handling, parallel tool execution, and prompt caching. These features position it well for applications requiring multimodal understanding and structured data extraction within search contexts. Users should note that this is a preview release specifically tuned for search scenarios, which may influence its behavior and performance characteristics compared to general-purpose GPT-4o variants. The stable capability profile suggests OpenAI is focusing on refinement and optimization of existing features rather than feature expansion for this specialized model. Organizations evaluating this model should consider their specific search and retrieval requirements when comparing it to other GPT-4o variants, as the search optimization may offer benefits in those particular use cases while maintaining broad compatibility with established GPT-4o capabilities.

Quality

Latency p50

Test runs

0

Stable capability profile maintained Full multimodal support retained Search-optimized specialization
Sección 08

Perfil completo del modelo

gpt-4o-search-preview-2025-03-11 — illustration 1
gpt-4o-search-preview-2025-03-11: el pin de búsqueda completa de marzo

gpt-4o-search-preview-2025-03-11 es la instantánea fechada de marzo de 2025 del modelo de chat con búsqueda aumentada de nivel completo de OpenAI. La congelación del alias rotativo gpt-4o-search-preview tal como estaba en esa fecha de lanzamiento, bloqueada para despliegues en producción que anclan contra un comportamiento de búsqueda específico.

Las respuestas con base en búsqueda tienen más dimensiones de comportamiento que el chat estándar: estrategia de consulta, selección de citas, estilo de síntesis, umbrales de cuándo-buscar. La instantánea pin las congela todas.

Qué representa esta instantánea

Para marzo de 2025, la preview de búsqueda completa había:

  • Estabilizado el formato de metadatos de citación que las instantáneas más recientes aún utilizan.
  • Establecido la estructura de facturación por llamada de búsqueda.
  • Resuelto las regresiones más disruptivas en la construcción de consultas de las versiones preview originales.

Lo que no tiene, en relación con instantáneas posteriores:

  • La reescritura de consultas mejorada que llegó a mediados de 2025 y redujo las llamadas de búsqueda por respuesta.
  • El refinamiento en el ranking de citaciones que promovió fuentes autorizadas de manera más agresiva.
  • Las mejoras de latencia derivadas de cambios en la infraestructura backend durante el segundo trimestre de 2025.

Para despliegues validados en la primavera de 2025, esta es muy probablemente la instantánea contra la cual pasó la validación.

Por qué el pin fechado importa más para búsqueda completa que para mini-búsqueda

Ambos niveles tienen las mismas dimensiones de comportamiento que pueden cambiar entre instantáneas, pero los cambios de comportamiento del nivel completo son más visibles porque las respuestas mismas son más largas y están más cuidadosamente sintetizadas.

Un cambio en la estrategia de consulta en el nivel completo podría significar que el modelo emite dos consultas de seguimiento donde la instantánea anterior emitió una, duplicando la latencia. Un cambio en el ranking de citaciones podría significar que las fuentes citadas se inclinan hacia dominios de mayor autoridad y se alejan de las fuentes de cola larga contra las que se probó tu QA. Un cambio en el estilo de síntesis podría significar que el mismo contenido recuperado produce una respuesta que se lee de manera suficientemente diferente como para confundir a los usuarios que han aprendido cómo suena tu producto.

Anclar a 2025-03-11 significa que todas esas permanecen constantes.

La cuestión de la migración

Misma forma que cualquier pin de instantánea fechada.

  • Mantén el pin de marzo en producción mientras evalúas.
  • Ejecuta una muestra representativa de tu mix de consultas real a través de ambas instantáneas.
  • Compara en calidad de citación, recuento de llamadas de búsqueda, latencia de extremo a extremo y estilo de síntesis. Observa las dimensiones que importan para tu producto, con la métrica de calidad agregada como una entrada más que como el factor decisivo.
  • Migra cuando la instantánea más nueva gane demostrablemente en las dimensiones que importan.

El argumento para migrar de un pin estable rara vez es "el nuevo es mejor en promedio". El argumento es "el nuevo es mejor en las cosas específicas sobre las que se construye mi producto".

Dónde falla

Mismas limitaciones que el resto de la línea de búsqueda completa.

Cargas de trabajo de investigación intensiva. Los modelos de la línea research están diseñados específicamente para síntesis de formato largo a través de muchas fuentes. Ver /benchmarks/methodology.

Conocimiento privado del dominio. Solo búsqueda en web pública. Construye tu propio RAG para documentos privados.

Q&A de alto volumen. Mini-search es el nivel de costo adecuado para tráfico a escala de consumidor.

Uso interactivo crítico en latencia. La búsqueda añade viajes de ida y vuelta. Tanto búsqueda completa como mini son más lentas que el chat sin búsqueda.

Despliegue auto-hospedado. Solo API de OpenAI. Ver /usecases/local para alternativas on-premise.

Cuándo anclar esta instantánea exacta

Elige gpt-4o-search-preview-2025-03-11 cuando:

  • Lanzaste un producto con base en búsqueda sobre el comportamiento de búsqueda completa de marzo de 2025 y necesitas mantenerlo estable.
  • El comportamiento de citación y el estilo de síntesis fueron parte de lo que pasó tu evaluación de primavera de 2025.
  • Un requisito de cumplimiento ancla la versión del modelo al nivel de instantánea para propósitos de auditoría.
  • Una prueba A/B o protocolo de investigación necesita una referencia fija de modelo de búsqueda a través de meses.

Omítela cuando:

  • Estás empezando desde cero — ancla la instantánea más reciente en su lugar.
  • Las mejoras de reescritura de consultas, ranking de citaciones o latencia en instantáneas posteriores han ganado en tu evaluación.
  • El lanzamiento estable eventual de la línea aumentada con búsqueda está disponible — ese es el objetivo correcto para nuevos proyectos.

Alternativas que vale la pena comparar

Las instantáneas de búsqueda completa más recientes cuando las mejoras de mediados de 2025 hayan ganado. Mini-search cuando la economía de alto volumen importa más que la calidad de síntesis. Los modelos de la línea research cuando la tarea cruza hacia síntesis de investigación de formato largo. El estudio más amplio en /usecases/content cubre cargas de trabajo de generación de contenido donde la base en búsqueda ayuda.

Notas de despliegue

API estándar de Chat Completions. La herramienta de búsqueda se invoca automáticamente basándose en el prompt. Los metadatos de citación se devuelven en un campo estructurado junto con la salida de texto del modelo.

La facturación de tokens divide texto de entrada, texto de salida y tarifas por llamada de búsqueda. La tarifa por llamada de búsqueda no ha cambiado entre las instantáneas de búsqueda completa hasta ahora, aunque la tasa a la que el modelo activa búsquedas puede variar entre instantáneas y por lo tanto también puede variar el costo efectivo por conversación.

El formato de metadatos de citación es estable a través de esta instantánea y las instantáneas posteriores de 2025, lo que mantiene el código de renderizado de UI reutilizable a través de cualquier migración futura.

La lectura pragmática. Esta es la congelación de marzo de 2025 de búsqueda de nivel completo. Anclala cuando tu producto con base en búsqueda fue validado contra ella y la estabilidad a nivel de instantánea importa. Migra cuando tu propia evaluación diga que la instantánea más nueva es el movimiento correcto en las dimensiones que importan para tu producto. Ejecuta comparaciones a nivel de consulta en /live-test antes de comprometerte.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

gpt-4o-search-preview-2025-03-11 — illustration 2
Última prueba automática
14 jun 2026 · 04:54 UTC · Benchmark
Latencia P50
4883 ms
Latencia P95
Errores
0 / 6 ejecuciones
Última revisión por Equipo Tokonomix·26 de mayo de 2026