
gpt-4o-search-preview-2025-03-11 es la instantánea fechada de marzo de 2025 del modelo de chat con búsqueda aumentada de nivel completo de OpenAI. La congelación del alias rotativo gpt-4o-search-preview tal como estaba en esa fecha de lanzamiento, bloqueada para despliegues en producción que anclan contra un comportamiento de búsqueda específico.
Las respuestas con base en búsqueda tienen más dimensiones de comportamiento que el chat estándar: estrategia de consulta, selección de citas, estilo de síntesis, umbrales de cuándo-buscar. La instantánea pin las congela todas.
Qué representa esta instantánea
Para marzo de 2025, la preview de búsqueda completa había:
- Estabilizado el formato de metadatos de citación que las instantáneas más recientes aún utilizan.
- Establecido la estructura de facturación por llamada de búsqueda.
- Resuelto las regresiones más disruptivas en la construcción de consultas de las versiones preview originales.
Lo que no tiene, en relación con instantáneas posteriores:
- La reescritura de consultas mejorada que llegó a mediados de 2025 y redujo las llamadas de búsqueda por respuesta.
- El refinamiento en el ranking de citaciones que promovió fuentes autorizadas de manera más agresiva.
- Las mejoras de latencia derivadas de cambios en la infraestructura backend durante el segundo trimestre de 2025.
Para despliegues validados en la primavera de 2025, esta es muy probablemente la instantánea contra la cual pasó la validación.
Por qué el pin fechado importa más para búsqueda completa que para mini-búsqueda
Ambos niveles tienen las mismas dimensiones de comportamiento que pueden cambiar entre instantáneas, pero los cambios de comportamiento del nivel completo son más visibles porque las respuestas mismas son más largas y están más cuidadosamente sintetizadas.
Un cambio en la estrategia de consulta en el nivel completo podría significar que el modelo emite dos consultas de seguimiento donde la instantánea anterior emitió una, duplicando la latencia. Un cambio en el ranking de citaciones podría significar que las fuentes citadas se inclinan hacia dominios de mayor autoridad y se alejan de las fuentes de cola larga contra las que se probó tu QA. Un cambio en el estilo de síntesis podría significar que el mismo contenido recuperado produce una respuesta que se lee de manera suficientemente diferente como para confundir a los usuarios que han aprendido cómo suena tu producto.
Anclar a 2025-03-11 significa que todas esas permanecen constantes.
La cuestión de la migración
Misma forma que cualquier pin de instantánea fechada.
- Mantén el pin de marzo en producción mientras evalúas.
- Ejecuta una muestra representativa de tu mix de consultas real a través de ambas instantáneas.
- Compara en calidad de citación, recuento de llamadas de búsqueda, latencia de extremo a extremo y estilo de síntesis. Observa las dimensiones que importan para tu producto, con la métrica de calidad agregada como una entrada más que como el factor decisivo.
- Migra cuando la instantánea más nueva gane demostrablemente en las dimensiones que importan.
El argumento para migrar de un pin estable rara vez es "el nuevo es mejor en promedio". El argumento es "el nuevo es mejor en las cosas específicas sobre las que se construye mi producto".
Dónde falla
Mismas limitaciones que el resto de la línea de búsqueda completa.
Cargas de trabajo de investigación intensiva. Los modelos de la línea research están diseñados específicamente para síntesis de formato largo a través de muchas fuentes. Ver /benchmarks/methodology.
Conocimiento privado del dominio. Solo búsqueda en web pública. Construye tu propio RAG para documentos privados.
Q&A de alto volumen. Mini-search es el nivel de costo adecuado para tráfico a escala de consumidor.
Uso interactivo crítico en latencia. La búsqueda añade viajes de ida y vuelta. Tanto búsqueda completa como mini son más lentas que el chat sin búsqueda.
Despliegue auto-hospedado. Solo API de OpenAI. Ver /usecases/local para alternativas on-premise.
Cuándo anclar esta instantánea exacta
Elige gpt-4o-search-preview-2025-03-11 cuando:
- Lanzaste un producto con base en búsqueda sobre el comportamiento de búsqueda completa de marzo de 2025 y necesitas mantenerlo estable.
- El comportamiento de citación y el estilo de síntesis fueron parte de lo que pasó tu evaluación de primavera de 2025.
- Un requisito de cumplimiento ancla la versión del modelo al nivel de instantánea para propósitos de auditoría.
- Una prueba A/B o protocolo de investigación necesita una referencia fija de modelo de búsqueda a través de meses.
Omítela cuando:
- Estás empezando desde cero — ancla la instantánea más reciente en su lugar.
- Las mejoras de reescritura de consultas, ranking de citaciones o latencia en instantáneas posteriores han ganado en tu evaluación.
- El lanzamiento estable eventual de la línea aumentada con búsqueda está disponible — ese es el objetivo correcto para nuevos proyectos.
Alternativas que vale la pena comparar
Las instantáneas de búsqueda completa más recientes cuando las mejoras de mediados de 2025 hayan ganado. Mini-search cuando la economía de alto volumen importa más que la calidad de síntesis. Los modelos de la línea research cuando la tarea cruza hacia síntesis de investigación de formato largo. El estudio más amplio en /usecases/content cubre cargas de trabajo de generación de contenido donde la base en búsqueda ayuda.
Notas de despliegue
API estándar de Chat Completions. La herramienta de búsqueda se invoca automáticamente basándose en el prompt. Los metadatos de citación se devuelven en un campo estructurado junto con la salida de texto del modelo.
La facturación de tokens divide texto de entrada, texto de salida y tarifas por llamada de búsqueda. La tarifa por llamada de búsqueda no ha cambiado entre las instantáneas de búsqueda completa hasta ahora, aunque la tasa a la que el modelo activa búsquedas puede variar entre instantáneas y por lo tanto también puede variar el costo efectivo por conversación.
El formato de metadatos de citación es estable a través de esta instantánea y las instantáneas posteriores de 2025, lo que mantiene el código de renderizado de UI reutilizable a través de cualquier migración futura.
La lectura pragmática. Esta es la congelación de marzo de 2025 de búsqueda de nivel completo. Anclala cuando tu producto con base en búsqueda fue validado contra ella y la estabilidad a nivel de instantánea importa. Migra cuando tu propia evaluación diga que la instantánea más nueva es el movimiento correcto en las dimensiones que importan para tu producto. Ejecuta comparaciones a nivel de consulta en /live-test antes de comprometerte.
Última revisión técnica: 2026-05-22 — Tokonomix.ai
