
gpt-4o-2024-05-13 es la versión original de GPT-4o, congelada en la primera disponibilidad pública del modelo el 13 de mayo de 2024. Es la versión fija datada del primer modelo multimodal de OpenAI de esta generación: el que introdujo comportamiento unificado de texto-visión-audio y redefinió lo que el sector esperaba de la superficie de un modelo de frontera.
Para la mayoría de los equipos, esta instantánea es ahora demasiado antigua para recomendarla. Para el conjunto limitado de casos donde la reproducibilidad contra el modelo de lanzamiento importa más que cualquier mejora posterior, sigue estando disponible.
Por qué importa esta fecha específica
El lanzamiento del 13 de mayo de 2024 fue el momento en que lo multimodal dejó de ser una demostración de investigación y se convirtió en un objetivo de despliegue. Las variantes anteriores de GPT-4 tenían soporte de visión, pero la superficie de audio y la menor latencia en texto fueron la contribución de 4o. Los equipos que archivaron evaluaciones o escribieron contratos con proveedores contra el modelo de lanzamiento necesitan un punto de referencia estable; esta instantánea es ese punto de referencia.
Dos razones específicas para preocuparse por esta fecha exacta.
Primero, trabajo de comparación. Los equipos de investigación que escriben sobre capacidad de modelos a través de generaciones necesitan un modelo que no haya cambiado silenciosamente bajo sus experimentos. La instantánea de lanzamiento es el modelo que fue puntuado en las notas de lanzamiento originales de OpenAI y en la mayor parte del trabajo de evaluación de terceros de mediados de 2024.
Segundo, despliegues regulados aprobados contra el modelo de lanzamiento. Algunos regímenes de cumplimiento requieren que cualquier modelo que toque datos de producción haya pasado por un ciclo de evaluación específico. Si tu auditor aprobó la versión de mayo de 2024 y la migración a una instantánea más nueva aún no ha pasado la revisión, este es el modelo que estás ejecutando.
Qué incluye esta instantánea
Todo lo que OpenAI distribuyó el día del lanzamiento. Entrada de texto e imagen con una ventana de contexto de 128k tokens. Superficies de audio a través de los endpoints contemporáneos. Modo JSON pero no la función posterior de salidas estructuradas (structured outputs) — eso llegó con la versión del 6 de agosto de 2024. Llamadas a funciones (function calling). Streaming. La superficie de Chat Completions; la superficie de Responses se añadió posteriormente y no forma parte del comportamiento de esta instantánea.
Lo que no está en esta instantánea es todo lo que llegó en las versiones posteriores de 4o. La actualización del 6 de agosto añadió salidas estructuradas estrictas y ajustó el comportamiento del modo JSON. La actualización del 20 de noviembre trajo mejoras en razonamiento y calidad de escritura. Ninguna de esas mejoras está en la instantánea de mayo. Si tu pipeline descendente depende de un comportamiento específico de salida estructurada, verifica contra qué instantánea fue construido antes de asumir que la versión fija de mayo es la opción correcta.
Riesgo de retirada
Esta es la instantánea de 4o más antigua que sigue estando disponible de forma rutinaria, lo que significa que es la más cercana a su fecha de retirada. El horizonte típico de depreciación de OpenAI para instantáneas datadas va de doce a dieciocho meses desde el lanzamiento. El modelo de lanzamiento de mayo de 2024 ya ha superado el extremo temprano de esa ventana.
Planifica la migración de forma activa. Ten en cuenta que "la instantánea todavía responde" hoy no es una garantía de que responderá mañana. Establece un recordatorio en el calendario, ejecuta una re-evaluación contra gpt-4o-2024-11-20 o contra la etiqueta flotante gpt-4o para establecer la línea base del delta de comportamiento, y ten la migración lista para desplegar antes de que se anuncie la fecha de depreciación en lugar de después.
Los equipos que esperan el correo electrónico de depreciación tienden a descubrir que su pipeline de producción dependía de un comportamiento específico de la instantánea de lanzamiento que las instantáneas más nuevas han cambiado silenciosamente. El trabajo de migración es más costoso cuando lo estás haciendo bajo presión de tiempo.
Qué cambió entre esta instantánea y las posteriores
Los deltas de comportamiento que vale la pena conocer si estás decidiendo si permanecer en la versión fija de lanzamiento o avanzar.
Salidas estructuradas. La instantánea de mayo soporta modo JSON pero no impone esquemas tan estrictamente como la versión de agosto. Los analizadores descendentes que se apoyan en validación de esquemas pueden fallar más a menudo contra esta instantánea.
Calibración de rechazos. El modelo de lanzamiento es más agresivo en ciertos patrones de rechazo que las instantáneas posteriores. Algunos prompts legítimos son rechazados aquí que pasan limpiamente en noviembre.
Razonamiento. La instantánea de noviembre es visiblemente más fuerte en prompts de múltiples pasos. Para cargas de trabajo que prueban calidad de razonamiento, la brecha es material.
Latencia. Las mejoras en la pila de inferencia a lo largo de 2024 significan que la etiqueta flotante ahora sirve la misma clase de modelo con menor latencia que la instantánea de lanzamiento. Fijar a esta fecha significa renunciar a esas mejoras.
Patrón de fijación
El patrón que ha envejecido bien:
- Fija en evaluación, CI y cualquier ruta auditada de cumplimiento.
- Flota en tráfico de producción.
- Diferencia semanalmente entre fijado y flotante contra un conjunto de prompts fijos para capturar la deriva de comportamiento temprano.
Para la instantánea de lanzamiento de mayo de 2024 específicamente, añade: ten un plan de migración documentado a una instantánea más nueva de 4o o a la familia GPT-4.1 antes de que llegue la fecha de depreciación.
Para el contexto más amplio de 4o, consulta la página flotante de GPT-4o. Para la familia más nueva que la mayoría de las nuevas construcciones deberían apuntar, consulta GPT-4.1.
Elegirlo
Usa gpt-4o-2024-05-13 cuando:
- Estás reproduciendo un resultado específico vinculado al modelo de lanzamiento.
- Un régimen de cumplimiento aprobó este identificador exacto y una re-aprobación está en curso.
- Un flujo de trabajo de investigación requiere el comportamiento de referencia de mayo de 2024.
Para todo lo demás, muévete a una instantánea más nueva o a la etiqueta flotante. La instantánea de lanzamiento fue un hito; ya no es el nivel de servicio correcto.
Última revisión técnica: 2026-05-22 — Tokonomix.ai
