
gpt-4o-mini-search-preview-2025-03-11 es la instantánea fechada de marzo de 2025 del modelo pequeño de chat con búsqueda aumentada de OpenAI. Misma arquitectura de herramienta de recuperación que el alias móvil, congelada en ese punto de lanzamiento para que los despliegues en producción puedan fijar contra un comportamiento conocido.
Las respuestas fundamentadas en búsqueda son inusualmente sensibles a la deriva de versión del modelo. Fijar una instantánea es lo que mantiene predecible el comportamiento de citación, las estrategias de consulta y el estilo de síntesis mientras OpenAI continúa iterando sobre la línea preview.
Qué representa esta instantánea
Para marzo de 2025, la mini-search preview había:
- Estabilizado el formato de metadatos de citación que el alias móvil todavía utiliza.
- Consolidado la estructura de facturación por llamada de búsqueda.
- Resuelto las regresiones más disruptivas en la construcción de consultas de las primeras versiones preview.
Lo que no tiene, en relación con instantáneas posteriores:
- La reescritura de consultas mejorada que llegó a mediados de 2025 y redujo el número de llamadas de búsqueda por respuesta.
- Los refinamientos en el ranking de citaciones que promovieron fuentes autoritativas de manera más agresiva.
- Las mejoras de latencia provenientes de cambios de infraestructura backend durante el segundo trimestre de 2025.
Para despliegues validados en primavera de 2025, esta es muy probablemente la instantánea contra la cual pasó la validación.
Por qué la fijación fechada importa más para modelos de búsqueda
El chat con búsqueda aumentada tiene múltiples dimensiones comportamentales que pueden cambiar entre instantáneas, cada una de las cuales es visible en el producto:
- El número de llamadas de búsqueda por respuesta — cambia el perfil de latencia y el coste por solicitud.
- La elección de qué fuentes citar — afecta la autoridad percibida de la respuesta.
- El estilo de síntesis para combinar contenido recuperado con conocimiento pre-entrenado — afecta cómo se lee la respuesta.
- El umbral para cuando el modelo decide buscar en absoluto versus responder desde el pre-entrenamiento — afecta la cobertura de actualidad.
Una fijación de instantánea congela todas estas en su lugar. Rodar con el alias significa aceptar que cualquiera de ellas puede cambiar el día que OpenAI lance una nueva revisión.
La cuestión de la migración
Misma forma que cualquier fijación de instantánea fechada.
- Mantén la fijación de marzo en producción mientras evalúas.
- Vuelve a ejecutar un conjunto representativo de consultas contra la instantánea candidata más nueva.
- Compara en calidad de citación, eficiencia de llamadas de búsqueda, latencia y estilo de síntesis junto con la precisión bruta de la respuesta.
- Migra cuando la instantánea más nueva gane de manera demostrable en las dimensiones que importan para tu producto.
El caso para migrar desde una fijación estable rara vez es "la nueva es mejor en promedio". El caso es "la nueva es mejor en las cosas específicas sobre las que mi producto está construido". Sé honesto sobre en qué caso estás realmente.
Dónde falla
Razonamiento intenso sobre contenido recuperado. Mini es el modelo pequeño. La search preview completa es la escalada correcta cuando la síntesis se convierte en el cuello de botella.
Conocimiento privado de dominio. La herramienta de búsqueda indexa contenido web público. Los documentos internos necesitan un pipeline RAG separado.
Uso interactivo crítico en latencia. La búsqueda añade viajes de ida y vuelta. Mini-search es más rápida que la search preview completa pero todavía más lenta que las respuestas puramente generadas.
Despliegue auto-hospedado. La herramienta de búsqueda requiere la infraestructura backend de OpenAI. La revisión de /usecases/local cubre qué está disponible cuando las restricciones on-premises vinculan.
Cuándo fijar esta instantánea exacta
Elige gpt-4o-mini-search-preview-2025-03-11 cuando:
- Lanzaste una funcionalidad fundamentada en búsqueda sobre el comportamiento de mini-search de marzo de 2025 y necesitas mantenerla estable.
- El comportamiento de citación y la selección de fuentes fueron parte de lo que pasó tu evaluación de primavera de 2025.
- Una prueba A/B o protocolo de investigación necesita una referencia de modelo de búsqueda fija a lo largo de meses.
Omítela cuando:
- Estás empezando desde cero — fija la instantánea más reciente en su lugar.
- Las mejoras de reescritura de consultas o latencia en instantáneas posteriores han ganado en tu evaluación.
- El lanzamiento estable eventual de la línea con búsqueda aumentada está disponible — ese es el objetivo correcto para proyectos nuevos.
Notas de despliegue
API estándar de Chat Completions. La herramienta de búsqueda es invocada automáticamente por el modelo basándose en el prompt; la superficie de la API no cambia respecto a modelos sin búsqueda con la adición de metadatos de citación estructurados en la respuesta.
La facturación de tokens divide texto de entrada, texto de salida y tarifas por llamada de búsqueda. La tarifa por llamada de búsqueda no ha cambiado entre instantáneas mini-search hasta ahora, aunque la tasa a la que el modelo activa búsquedas puede variar entre instantáneas y por lo tanto también puede hacerlo el coste efectivo por conversación.
El formato de metadatos de citación es estable a través de esta instantánea y las instantáneas posteriores de 2025, lo que mantiene el código de renderizado de UI reutilizable a través de migraciones.
La lectura pragmática. Esta es la congelación de marzo de 2025 de mini-search. Fíjala cuando tu producto fue validado contra ella. Migra cuando tu propia evaluación diga que la instantánea más nueva es el movimiento correcto en las dimensiones que importan. Ejecuta comparaciones a nivel de consulta en /live-test antes de comprometerte.
Última revisión técnica: 2026-05-22 — Tokonomix.ai
