Ir al contenido
Tier C — Especialista
Se ejecuta en:USCreado en:United States
OpenAI

gpt-4o-2024-05-13

Tier C — Especialista

Equipo editorial Tokonomix·Revisado por Mes Kalkan··

GPT-4o-2024-05-13 es un modelo de lenguaje multimodal de gran escala desarrollado por OpenAI, lanzado en mayo de 2024. Este modelo representa la primera iteración de OpenAI de la serie GPT-4o, donde la designación "o" indica optimización tanto para entradas de texto como multimodales. Está diseñado para tareas de generación de texto de propósito general, incluyendo conversación, creación de contenido, análisis, asistencia de programación y razonamiento en diversos dominios. El modelo procesa entrada de texto y genera salida de texto con capacidades que abarcan múltiples idiomas y temas técnicos. Esta versión sirve como el lanzamiento de producción inicial de la arquitectura GPT-4o, ofreciendo capacidades estándar de generación de texto que equilibran rendimiento con accesibilidad. Aunque los detalles arquitectónicos específicos permanecen propietarios, el modelo se basa en la fundación establecida por variantes anteriores de GPT-4 mientras introduce refinamientos arquitectónicos orientados a mejorar la eficiencia y calidad de respuesta. El modelo admite conversaciones extendidas e instrucciones complejas, haciéndolo adecuado para aplicaciones que van desde preguntas y respuestas simples hasta tareas analíticas sofisticadas. Dentro de la línea de modelos de OpenAI, GPT-4o-2024-05-13 ocupa una posición central como modelo insignia de propósito general. Se sitúa junto a otras variantes de GPT-4 en la oferta de OpenAI, proporcionando una alternativa a los lanzamientos anteriores de GPT-4 y la serie más compacta GPT-3.5. El modelo está posicionado para usuarios que requieren capacidades avanzadas de comprensión y generación de lenguaje sin las características especializadas de variantes experimentales o específicas de dominio. Esta instantánea representa el estado del modelo en su fecha de lanzamiento de mayo de 2024.

GPT-4o de mayo 2024 es el primer lanzamiento de la serie omnimodal de OpenAI, estableciendo las bases de la arquitectura integrada de texto e imagen.

Resumen de benchmark Tokonomix
Sección 01

Puntuaciones de calidad

Resultados de evaluación de modelos juez en diversas categorías de tareas. Las puntuaciones reflejan coherencia, precisión y seguimiento de instrucciones.

100
Generación de código
99
Multilingüe
100
Razonamiento
Sección 02

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰
Tarifas API — gpt-4o-2024-05-13
$5.00 por 1M de tokens de entrada
$15.00 por 1M de tokens de salida
≈ $0.0060 por conversación típica (800 tokens)
Precio entrada vs salida (por 1M de tokens)
por 1M de tokens de entrada$5.00
por 1M de tokens de salida$15.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$5.00

input / 1M

— stable

$15.00

output / 1M

— stable

2026-05-242026-06-142026-06-14
Input
Output
Price change
⟳ synced weekly
Sección 03

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Primera versión omnimodal de OpenAIComportamiento de snapshot estableRazonamiento comparable a GPT-4 TurboBuena capacidad de codificaciónAnálisis multi-dominio sólidoAmplia compatibilidad de integraciones

Debilidades

Versión inicial; mejorada en releases posterioresVentana de contexto no documentada específicamenteAudio: solo en variantes especializadasAlgunas limitaciones resueltas en versiones posteriores
Sección 04

Capacidades

toolssource: litellmvisionpdf inputparallel toolsprompt cachingmax output tokens: 4096
Sección 05

Preguntas frecuentes

Para proyectos que requieren reproducibilidad exacta o que ya están probados con este snapshot específico.

El snapshot original de GPT-4o ofrece comportamiento predecible para integraciones que requieren reproducibilidad en producción.

Resumen de benchmark Tokonomix
Sección 06

Disponibilidad

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 07

Veredictos del benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-596/100 · 75 runs
70 correct5 partial0 wrong93% accuracy
2026-06-14

Quality stable at 97.7 with new tools, vision, and caching capabilities

The gpt-4o-2024-05-13 model maintains its quality score at 97.7, demonstrating consistency across benchmark windows. This stability occurs alongside significant capability expansion, with the addition of tools, vision, PDF input, parallel tools, and prompt caching support. These enhancements position the model for more complex multimodal and workflow-oriented tasks without compromising its core performance metrics. The unchanged quality score suggests that OpenAI successfully integrated these new features while preserving the model's fundamental reasoning and generation capabilities. Users can now leverage vision-based tasks, process PDF documents directly, utilize function calling with parallel execution, and benefit from prompt caching for improved efficiency in repetitive operations. The model continues to deliver the same reliable performance baseline established in previous benchmarks while offering substantially broader functionality. Organizations already using this model can adopt these new capabilities with confidence that quality remains consistent. The combination of maintained performance and expanded feature set makes this a meaningful update for users requiring multimodal processing or advanced tool integration in their workflows.

Quality

Latency p50

Test runs

0

Quality maintained at 97.7 Vision and PDF support added Tool calling capabilities expanded Prompt caching now available
Sección 08

Perfil completo del modelo

gpt-4o-2024-05-13 — illustration 1
gpt-4o-2024-05-13: la instantánea del lanzamiento

gpt-4o-2024-05-13 es la versión original de GPT-4o, congelada en la primera disponibilidad pública del modelo el 13 de mayo de 2024. Es la versión fija datada del primer modelo multimodal de OpenAI de esta generación: el que introdujo comportamiento unificado de texto-visión-audio y redefinió lo que el sector esperaba de la superficie de un modelo de frontera.

Para la mayoría de los equipos, esta instantánea es ahora demasiado antigua para recomendarla. Para el conjunto limitado de casos donde la reproducibilidad contra el modelo de lanzamiento importa más que cualquier mejora posterior, sigue estando disponible.

Por qué importa esta fecha específica

El lanzamiento del 13 de mayo de 2024 fue el momento en que lo multimodal dejó de ser una demostración de investigación y se convirtió en un objetivo de despliegue. Las variantes anteriores de GPT-4 tenían soporte de visión, pero la superficie de audio y la menor latencia en texto fueron la contribución de 4o. Los equipos que archivaron evaluaciones o escribieron contratos con proveedores contra el modelo de lanzamiento necesitan un punto de referencia estable; esta instantánea es ese punto de referencia.

Dos razones específicas para preocuparse por esta fecha exacta.

Primero, trabajo de comparación. Los equipos de investigación que escriben sobre capacidad de modelos a través de generaciones necesitan un modelo que no haya cambiado silenciosamente bajo sus experimentos. La instantánea de lanzamiento es el modelo que fue puntuado en las notas de lanzamiento originales de OpenAI y en la mayor parte del trabajo de evaluación de terceros de mediados de 2024.

Segundo, despliegues regulados aprobados contra el modelo de lanzamiento. Algunos regímenes de cumplimiento requieren que cualquier modelo que toque datos de producción haya pasado por un ciclo de evaluación específico. Si tu auditor aprobó la versión de mayo de 2024 y la migración a una instantánea más nueva aún no ha pasado la revisión, este es el modelo que estás ejecutando.

Qué incluye esta instantánea

Todo lo que OpenAI distribuyó el día del lanzamiento. Entrada de texto e imagen con una ventana de contexto de 128k tokens. Superficies de audio a través de los endpoints contemporáneos. Modo JSON pero no la función posterior de salidas estructuradas (structured outputs) — eso llegó con la versión del 6 de agosto de 2024. Llamadas a funciones (function calling). Streaming. La superficie de Chat Completions; la superficie de Responses se añadió posteriormente y no forma parte del comportamiento de esta instantánea.

Lo que no está en esta instantánea es todo lo que llegó en las versiones posteriores de 4o. La actualización del 6 de agosto añadió salidas estructuradas estrictas y ajustó el comportamiento del modo JSON. La actualización del 20 de noviembre trajo mejoras en razonamiento y calidad de escritura. Ninguna de esas mejoras está en la instantánea de mayo. Si tu pipeline descendente depende de un comportamiento específico de salida estructurada, verifica contra qué instantánea fue construido antes de asumir que la versión fija de mayo es la opción correcta.

Riesgo de retirada

Esta es la instantánea de 4o más antigua que sigue estando disponible de forma rutinaria, lo que significa que es la más cercana a su fecha de retirada. El horizonte típico de depreciación de OpenAI para instantáneas datadas va de doce a dieciocho meses desde el lanzamiento. El modelo de lanzamiento de mayo de 2024 ya ha superado el extremo temprano de esa ventana.

Planifica la migración de forma activa. Ten en cuenta que "la instantánea todavía responde" hoy no es una garantía de que responderá mañana. Establece un recordatorio en el calendario, ejecuta una re-evaluación contra gpt-4o-2024-11-20 o contra la etiqueta flotante gpt-4o para establecer la línea base del delta de comportamiento, y ten la migración lista para desplegar antes de que se anuncie la fecha de depreciación en lugar de después.

Los equipos que esperan el correo electrónico de depreciación tienden a descubrir que su pipeline de producción dependía de un comportamiento específico de la instantánea de lanzamiento que las instantáneas más nuevas han cambiado silenciosamente. El trabajo de migración es más costoso cuando lo estás haciendo bajo presión de tiempo.

Qué cambió entre esta instantánea y las posteriores

Los deltas de comportamiento que vale la pena conocer si estás decidiendo si permanecer en la versión fija de lanzamiento o avanzar.

Salidas estructuradas. La instantánea de mayo soporta modo JSON pero no impone esquemas tan estrictamente como la versión de agosto. Los analizadores descendentes que se apoyan en validación de esquemas pueden fallar más a menudo contra esta instantánea.

Calibración de rechazos. El modelo de lanzamiento es más agresivo en ciertos patrones de rechazo que las instantáneas posteriores. Algunos prompts legítimos son rechazados aquí que pasan limpiamente en noviembre.

Razonamiento. La instantánea de noviembre es visiblemente más fuerte en prompts de múltiples pasos. Para cargas de trabajo que prueban calidad de razonamiento, la brecha es material.

Latencia. Las mejoras en la pila de inferencia a lo largo de 2024 significan que la etiqueta flotante ahora sirve la misma clase de modelo con menor latencia que la instantánea de lanzamiento. Fijar a esta fecha significa renunciar a esas mejoras.

Patrón de fijación

El patrón que ha envejecido bien:

  • Fija en evaluación, CI y cualquier ruta auditada de cumplimiento.
  • Flota en tráfico de producción.
  • Diferencia semanalmente entre fijado y flotante contra un conjunto de prompts fijos para capturar la deriva de comportamiento temprano.

Para la instantánea de lanzamiento de mayo de 2024 específicamente, añade: ten un plan de migración documentado a una instantánea más nueva de 4o o a la familia GPT-4.1 antes de que llegue la fecha de depreciación.

Para el contexto más amplio de 4o, consulta la página flotante de GPT-4o. Para la familia más nueva que la mayoría de las nuevas construcciones deberían apuntar, consulta GPT-4.1.

Elegirlo

Usa gpt-4o-2024-05-13 cuando:

  • Estás reproduciendo un resultado específico vinculado al modelo de lanzamiento.
  • Un régimen de cumplimiento aprobó este identificador exacto y una re-aprobación está en curso.
  • Un flujo de trabajo de investigación requiere el comportamiento de referencia de mayo de 2024.

Para todo lo demás, muévete a una instantánea más nueva o a la etiqueta flotante. La instantánea de lanzamiento fue un hito; ya no es el nivel de servicio correcto.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

gpt-4o-2024-05-13 — illustration 2
Última prueba automática
14 jun 2026 · 05:02 UTC · Benchmark
Latencia P50
1049 ms
Latencia P95
Errores
0 / 6 ejecuciones
Última revisión por Equipo Tokonomix·26 de mayo de 2026