¿El estado de vista previa afecta la estabilidad para producción?

Sí. La designación 'preview' indica que es una versión de desarrollo destinada a recopilar retroalimentación. OpenAI puede realizar cambios en el comportamiento, disponibilidad o características sin previo aviso, por lo que se recomienda precaución en aplicaciones críticas.

¿Cuándo realiza el modelo búsquedas web?

El modelo decide automáticamente cuándo una consulta requiere información actualizada o externa. Esta decisión se basa en la naturaleza de la pregunta, si requiere datos recientes, hechos verificables o eventos posteriores a su entrenamiento.

¿Se pueden desactivar las búsquedas para ciertas consultas?

Las especificaciones exactas de control no han sido completamente documentadas para esta vista previa. Se recomienda consultar la documentación oficial de OpenAI para conocer los parámetros de configuración disponibles y opciones de control de búsqueda.

¿Este modelo reemplazará a GPT-4o estándar?

No necesariamente. Como vista previa experimental, este modelo explora la integración de búsqueda en la arquitectura GPT-4o. Es probable que OpenAI ofrezca múltiples variantes según casos de uso: modelos estándar para tareas tradicionales y variantes con búsqueda para aplicaciones que requieren información actualizada.

Tier C — Especialista

Se ejecuta en:USCreado en:United States

Archivado

Este modelo ha sido descontinuado por el proveedor. Los datos históricos se conservan.

Ya no está disponible desde el 26 de julio de 2026.

OpenAI

gpt-4o-search-preview-2025-03-11

Tier C — Especialista

Equipo editorial Tokonomix·Revisado por Mes Kalkan·Publicado 22 de mayo de 2026·Última revisión 26 de mayo de 2026

GPT-4o-search-preview-2025-03-11 es una variante de la familia de modelos GPT-4o de OpenAI que integra capacidades de búsqueda con funcionalidad de modelo de lenguaje grande. Este modelo está diseñado para combinar la comprensión y generación de lenguaje natural con la capacidad de recuperar e incorporar información actual de búsquedas web, permitiéndole proporcionar respuestas que reflejan eventos y datos recientes más allá de su fecha límite de entrenamiento. Representa un enfoque experimental para abordar las limitaciones de actualidad del conocimiento inherentes a los modelos de lenguaje estáticos. El modelo mantiene las características arquitectónicas centrales de la serie GPT-4o, incluyendo capacidades de comprensión multimodal, aunque su característica distintiva principal es la funcionalidad de búsqueda integrada que le permite aumentar las respuestas generadas con información recuperada. El tamaño de la ventana de contexto para esta variante particular no ha sido especificado públicamente por OpenAI. Es capaz de realizar tareas estándar de generación de texto incluyendo análisis, resumen, escritura creativa y resolución de problemas técnicos, con la dimensión adicional de poder referenciar información contemporánea cuando sea apropiado. Dentro de la línea de modelos de OpenAI, GPT-4o-search-preview-2025-03-11 ocupa una posición experimental, sirviendo como un lanzamiento preliminar que demuestra la integración de generación aumentada por recuperación en la arquitectura GPT-4o. La designación "preview" indica que esta es una versión de desarrollo destinada a recopilar retroalimentación y evaluar el rendimiento antes de un posible despliegue más amplio. Se sitúa junto a otras variantes de GPT-4o que se enfocan en diferentes objetivos de optimización como velocidad, eficiencia de costos o capacidades de razonamiento especializadas.

GPT-4o-search-preview representa el primer intento de OpenAI de fusionar su modelo insignia con capacidades de búsqueda en tiempo real, abriendo la puerta a respuestas fundamentadas en información actualizada sin depender de reentrenamiento constante.
— Análisis editorial de Tokonomix

Sección 01

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰

Tarifas API — gpt-4o-search-preview-2025-03-11

$2.50 por 1M de tokens de entrada

$10.00 por 1M de tokens de salida

≈ $0.0035 por conversación típica (800 tokens)

Precio entrada vs salida (por 1M de tokens)

por 1M de tokens de entrada$2.50

por 1M de tokens de salida$10.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.50

input / 1M

— stable

$10.00

output / 1M

— stable

2026-05-242026-06-282026-07-26

Input

Output

Price change

⟳ synced weekly

Sección 02

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Búsqueda web integrada nativamenteAcceso a información actualizada y recienteRazonamiento GPT-4o con datos contemporáneosGeneración aumentada por recuperaciónSupera limitaciones de corte de entrenamientoRespuestas contextualizadas con fuentes actualesCombina comprensión multimodal con búsquedaIdeal para análisis de eventos recientes

Debilidades

Estado experimental y vista previaEspecificaciones técnicas no divulgadasVentana de contexto sin confirmar públicamenteLatencia potencialmente mayor por búsquedas

Sección 03

Capacidades

toolssource: litellmvisionjson modepdf inputjson schemaparallel toolsprompt cachingmax output tokens: 16384

Sección 04

Preguntas frecuentes

Integra capacidades de búsqueda web directamente en el flujo de generación, permitiendo que el modelo acceda y cite información actualizada más allá de su fecha de corte de entrenamiento. Esto lo hace especialmente útil para consultas que requieren datos recientes o eventos actuales.

Para equipos que necesitan combinar razonamiento avanzado con acceso a información contemporánea, esta vista previa ofrece un vistazo prometedor al futuro de los modelos aumentados por recuperación, aunque su estado experimental requiere precaución en implementaciones críticas.
— Resumen de Tokonomix

Sección 05

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 06

Veredictos del benchmark Tokonomix

⚖️

Endorsed by 1 judge

Independent LLM judges evaluated this model on our weekly intelligence tests

claude-sonnet-4-593/100 · 106 runs

91 correct12 partial3 wrong86% accuracy

● 2026-07-26

Search model adds multimodal support and advanced tooling capabilities

The gpt-4o-search-preview model has been significantly enhanced with a suite of new capabilities while maintaining its core search-optimized functionality. The model now supports vision input, allowing it to process and analyze images alongside text. Tool usage capabilities have been substantially expanded, including support for parallel tool execution, JSON mode output, JSON schema validation, and prompt caching for improved efficiency. PDF input support has also been added, enabling direct document processing. These additions transform the model from a text-only search specialist into a more versatile multimodal assistant capable of handling complex workflows. The search-preview designation indicates this remains an experimental model optimized for information retrieval tasks, now with enhanced capabilities for structured output and multi-step reasoning. Users should expect continued iteration on these features as OpenAI refines the search-optimized architecture. The combination of search specialization with vision and advanced tooling makes this model particularly suitable for research tasks, document analysis, and applications requiring both information retrieval and structured data processing. As a preview model, stability and feature availability may change as development continues.

Quality

—

Latency p50

—

Test runs

✓ Vision support added✓ Advanced tool capabilities enabled✓ PDF input now supported✓ Prompt caching available

Sección 07

Perfil completo del modelo

gpt-4o-search-preview-2025-03-11: el pin de búsqueda completa de marzo

gpt-4o-search-preview-2025-03-11 es la instantánea fechada de marzo de 2025 del modelo de chat con búsqueda aumentada de nivel completo de OpenAI. La congelación del alias rotativo gpt-4o-search-preview tal como estaba en esa fecha de lanzamiento, bloqueada para despliegues en producción que anclan contra un comportamiento de búsqueda específico.

Las respuestas con base en búsqueda tienen más dimensiones de comportamiento que el chat estándar: estrategia de consulta, selección de citas, estilo de síntesis, umbrales de cuándo-buscar. La instantánea pin las congela todas.

Qué representa esta instantánea

Para marzo de 2025, la preview de búsqueda completa había:

Estabilizado el formato de metadatos de citación que las instantáneas más recientes aún utilizan.
Establecido la estructura de facturación por llamada de búsqueda.
Resuelto las regresiones más disruptivas en la construcción de consultas de las versiones preview originales.

Lo que no tiene, en relación con instantáneas posteriores:

La reescritura de consultas mejorada que llegó a mediados de 2025 y redujo las llamadas de búsqueda por respuesta.
El refinamiento en el ranking de citaciones que promovió fuentes autorizadas de manera más agresiva.
Las mejoras de latencia derivadas de cambios en la infraestructura backend durante el segundo trimestre de 2025.

Para despliegues validados en la primavera de 2025, esta es muy probablemente la instantánea contra la cual pasó la validación.

Por qué el pin fechado importa más para búsqueda completa que para mini-búsqueda

Ambos niveles tienen las mismas dimensiones de comportamiento que pueden cambiar entre instantáneas, pero los cambios de comportamiento del nivel completo son más visibles porque las respuestas mismas son más largas y están más cuidadosamente sintetizadas.

Un cambio en la estrategia de consulta en el nivel completo podría significar que el modelo emite dos consultas de seguimiento donde la instantánea anterior emitió una, duplicando la latencia. Un cambio en el ranking de citaciones podría significar que las fuentes citadas se inclinan hacia dominios de mayor autoridad y se alejan de las fuentes de cola larga contra las que se probó tu QA. Un cambio en el estilo de síntesis podría significar que el mismo contenido recuperado produce una respuesta que se lee de manera suficientemente diferente como para confundir a los usuarios que han aprendido cómo suena tu producto.

Anclar a 2025-03-11 significa que todas esas permanecen constantes.

La cuestión de la migración

Misma forma que cualquier pin de instantánea fechada.

Mantén el pin de marzo en producción mientras evalúas.
Ejecuta una muestra representativa de tu mix de consultas real a través de ambas instantáneas.
Compara en calidad de citación, recuento de llamadas de búsqueda, latencia de extremo a extremo y estilo de síntesis. Observa las dimensiones que importan para tu producto, con la métrica de calidad agregada como una entrada más que como el factor decisivo.
Migra cuando la instantánea más nueva gane demostrablemente en las dimensiones que importan.

El argumento para migrar de un pin estable rara vez es "el nuevo es mejor en promedio". El argumento es "el nuevo es mejor en las cosas específicas sobre las que se construye mi producto".

Dónde falla

Mismas limitaciones que el resto de la línea de búsqueda completa.

Cargas de trabajo de investigación intensiva. Los modelos de la línea research están diseñados específicamente para síntesis de formato largo a través de muchas fuentes. Ver /benchmarks/methodology.

Conocimiento privado del dominio. Solo búsqueda en web pública. Construye tu propio RAG para documentos privados.

Q&A de alto volumen. Mini-search es el nivel de costo adecuado para tráfico a escala de consumidor.

Uso interactivo crítico en latencia. La búsqueda añade viajes de ida y vuelta. Tanto búsqueda completa como mini son más lentas que el chat sin búsqueda.

Despliegue auto-hospedado. Solo API de OpenAI. Ver /usecases/local para alternativas on-premise.

Cuándo anclar esta instantánea exacta

Elige gpt-4o-search-preview-2025-03-11 cuando:

Lanzaste un producto con base en búsqueda sobre el comportamiento de búsqueda completa de marzo de 2025 y necesitas mantenerlo estable.
El comportamiento de citación y el estilo de síntesis fueron parte de lo que pasó tu evaluación de primavera de 2025.
Un requisito de cumplimiento ancla la versión del modelo al nivel de instantánea para propósitos de auditoría.
Una prueba A/B o protocolo de investigación necesita una referencia fija de modelo de búsqueda a través de meses.

Omítela cuando:

Estás empezando desde cero — ancla la instantánea más reciente en su lugar.
Las mejoras de reescritura de consultas, ranking de citaciones o latencia en instantáneas posteriores han ganado en tu evaluación.
El lanzamiento estable eventual de la línea aumentada con búsqueda está disponible — ese es el objetivo correcto para nuevos proyectos.

Alternativas que vale la pena comparar

Las instantáneas de búsqueda completa más recientes cuando las mejoras de mediados de 2025 hayan ganado. Mini-search cuando la economía de alto volumen importa más que la calidad de síntesis. Los modelos de la línea research cuando la tarea cruza hacia síntesis de investigación de formato largo. El estudio más amplio en /usecases/content cubre cargas de trabajo de generación de contenido donde la base en búsqueda ayuda.

Notas de despliegue

API estándar de Chat Completions. La herramienta de búsqueda se invoca automáticamente basándose en el prompt. Los metadatos de citación se devuelven en un campo estructurado junto con la salida de texto del modelo.

La facturación de tokens divide texto de entrada, texto de salida y tarifas por llamada de búsqueda. La tarifa por llamada de búsqueda no ha cambiado entre las instantáneas de búsqueda completa hasta ahora, aunque la tasa a la que el modelo activa búsquedas puede variar entre instantáneas y por lo tanto también puede variar el costo efectivo por conversación.

El formato de metadatos de citación es estable a través de esta instantánea y las instantáneas posteriores de 2025, lo que mantiene el código de renderizado de UI reutilizable a través de cualquier migración futura.

La lectura pragmática. Esta es la congelación de marzo de 2025 de búsqueda de nivel completo. Anclala cuando tu producto con base en búsqueda fue validado contra ella y la estabilidad a nivel de instantánea importa. Migra cuando tu propia evaluación diga que la instantánea más nueva es el movimiento correcto en las dimensiones que importan para tu producto. Ejecuta comparaciones a nivel de consulta en /live-test antes de comprometerte.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

Última prueba automática

26 jul 2026 · 05:30 UTC · Benchmark

Latencia P50

—

Latencia P95

—

Errores

1 / 6 ejecuciones

Última revisión por Equipo Tokonomix·26 de mayo de 2026