Tier C — Especialista

Se ejecuta en:USCreado en:United States

$15.00

salida · por 1M de tokens (coste base)

Coste

1,695 ms

Velocidad de respuesta

100 / 100

Inteligencia

Veredicto — resumenLIVE

● LIVE

ahora · 2026-07-26

Quality decline and latency increase observed across core performance metrics

✗ Quality score dropped 5 points✗ Latency increased 43%✓ Multilingual performance remains perfect✓ Strong reasoning score at 99

This benchmark window reveals notable performance degradation for gpt-4o-2024-05-13 compared to the previous evaluation period. The overall quality score dropped from 98.3 to 93.4, representing a 5-point decline that affects the model's competitive positioning. Latency deteriorated significantly, with the median response time increasing 43% from 1235ms to 1766ms, which may impact user experience in interactive applications. Category performance shows mixed results. Multilingual capabilities remained excellent at 100, maintaining parity with previous performance. Reasoning scored impressively at 99, demonstrating strong logical capabilities. However, factual accuracy scored only 83, suggesting potential reliability concerns for knowledge-intensive tasks. Creative performance at 92 shows a slight decline from the previous 95. The absence of coding scores in the current window prevents direct comparison in this critical category, though it previously achieved a perfect 100. Users should be aware of the latency increase when deploying this model in time-sensitive applications. The quality score reduction, while keeping the model in high-performance territory, indicates some regression that may warrant monitoring. Organizations relying on factual accuracy should conduct additional validation given the lower score in this category.

Quality

93.4

Latency p50

1,766 ms

Test runs

1 de 14

Imagen y explicaciónLIVE

OpenAI

gpt-4o-2024-05-13

Tier C — Especialista

Equipo editorial Tokonomix·Revisado por Mes Kalkan·Publicado 22 de mayo de 2026·Última revisión 26 de mayo de 2026

GPT-4o-2024-05-13 es un modelo de lenguaje multimodal de gran escala desarrollado por OpenAI, lanzado en mayo de 2024. Este modelo representa la primera iteración de OpenAI de la serie GPT-4o, donde la designación "o" indica optimización tanto para entradas de texto como multimodales. Está diseñado para tareas de generación de texto de propósito general, incluyendo conversación, creación de contenido, análisis, asistencia de programación y razonamiento en diversos dominios. El modelo procesa entrada de texto y genera salida de texto con capacidades que abarcan múltiples idiomas y temas técnicos. Esta versión sirve como el lanzamiento de producción inicial de la arquitectura GPT-4o, ofreciendo capacidades estándar de generación de texto que equilibran rendimiento con accesibilidad. Aunque los detalles arquitectónicos específicos permanecen propietarios, el modelo se basa en la fundación establecida por variantes anteriores de GPT-4 mientras introduce refinamientos arquitectónicos orientados a mejorar la eficiencia y calidad de respuesta. El modelo admite conversaciones extendidas e instrucciones complejas, haciéndolo adecuado para aplicaciones que van desde preguntas y respuestas simples hasta tareas analíticas sofisticadas. Dentro de la línea de modelos de OpenAI, GPT-4o-2024-05-13 ocupa una posición central como modelo insignia de propósito general. Se sitúa junto a otras variantes de GPT-4 en la oferta de OpenAI, proporcionando una alternativa a los lanzamientos anteriores de GPT-4 y la serie más compacta GPT-3.5. El modelo está posicionado para usuarios que requieren capacidades avanzadas de comprensión y generación de lenguaje sin las características especializadas de variantes experimentales o específicas de dominio. Esta instantánea representa el estado del modelo en su fecha de lanzamiento de mayo de 2024.

GPT-4o de mayo 2024 es el primer lanzamiento de la serie omnimodal de OpenAI, estableciendo las bases de la arquitectura integrada de texto e imagen.
— Resumen de benchmark Tokonomix

Capacidades

toolssource: litellmvisionpdf inputparallel toolsprompt cachingmax output tokens: 4096

gpt-4o-2024-05-13: la instantánea del lanzamiento

gpt-4o-2024-05-13 es la versión original de GPT-4o, congelada en la primera disponibilidad pública del modelo el 13 de mayo de 2024. Es la versión fija datada del primer modelo multimodal de OpenAI de esta generación: el que introdujo comportamiento unificado de texto-visión-audio y redefinió lo que el sector esperaba de la superficie de un modelo de frontera.

Para la mayoría de los equipos, esta instantánea es ahora demasiado antigua para recomendarla. Para el conjunto limitado de casos donde la reproducibilidad contra el modelo de lanzamiento importa más que cualquier mejora posterior, sigue estando disponible.

Por qué importa esta fecha específica

El lanzamiento del 13 de mayo de 2024 fue el momento en que lo multimodal dejó de ser una demostración de investigación y se convirtió en un objetivo de despliegue. Las variantes anteriores de GPT-4 tenían soporte de visión, pero la superficie de audio y la menor latencia en texto fueron la contribución de 4o. Los equipos que archivaron evaluaciones o escribieron contratos con proveedores contra el modelo de lanzamiento necesitan un punto de referencia estable; esta instantánea es ese punto de referencia.

Dos razones específicas para preocuparse por esta fecha exacta.

Primero, trabajo de comparación. Los equipos de investigación que escriben sobre capacidad de modelos a través de generaciones necesitan un modelo que no haya cambiado silenciosamente bajo sus experimentos. La instantánea de lanzamiento es el modelo que fue puntuado en las notas de lanzamiento originales de OpenAI y en la mayor parte del trabajo de evaluación de terceros de mediados de 2024.

Segundo, despliegues regulados aprobados contra el modelo de lanzamiento. Algunos regímenes de cumplimiento requieren que cualquier modelo que toque datos de producción haya pasado por un ciclo de evaluación específico. Si tu auditor aprobó la versión de mayo de 2024 y la migración a una instantánea más nueva aún no ha pasado la revisión, este es el modelo que estás ejecutando.

Qué incluye esta instantánea

Todo lo que OpenAI distribuyó el día del lanzamiento. Entrada de texto e imagen con una ventana de contexto de 128k tokens. Superficies de audio a través de los endpoints contemporáneos. Modo JSON pero no la función posterior de salidas estructuradas (structured outputs) — eso llegó con la versión del 6 de agosto de 2024. Llamadas a funciones (function calling). Streaming. La superficie de Chat Completions; la superficie de Responses se añadió posteriormente y no forma parte del comportamiento de esta instantánea.

Lo que no está en esta instantánea es todo lo que llegó en las versiones posteriores de 4o. La actualización del 6 de agosto añadió salidas estructuradas estrictas y ajustó el comportamiento del modo JSON. La actualización del 20 de noviembre trajo mejoras en razonamiento y calidad de escritura. Ninguna de esas mejoras está en la instantánea de mayo. Si tu pipeline descendente depende de un comportamiento específico de salida estructurada, verifica contra qué instantánea fue construido antes de asumir que la versión fija de mayo es la opción correcta.

Riesgo de retirada

Esta es la instantánea de 4o más antigua que sigue estando disponible de forma rutinaria, lo que significa que es la más cercana a su fecha de retirada. El horizonte típico de depreciación de OpenAI para instantáneas datadas va de doce a dieciocho meses desde el lanzamiento. El modelo de lanzamiento de mayo de 2024 ya ha superado el extremo temprano de esa ventana.

Planifica la migración de forma activa. Ten en cuenta que "la instantánea todavía responde" hoy no es una garantía de que responderá mañana. Establece un recordatorio en el calendario, ejecuta una re-evaluación contra gpt-4o-2024-11-20 o contra la etiqueta flotante gpt-4o para establecer la línea base del delta de comportamiento, y ten la migración lista para desplegar antes de que se anuncie la fecha de depreciación en lugar de después.

Los equipos que esperan el correo electrónico de depreciación tienden a descubrir que su pipeline de producción dependía de un comportamiento específico de la instantánea de lanzamiento que las instantáneas más nuevas han cambiado silenciosamente. El trabajo de migración es más costoso cuando lo estás haciendo bajo presión de tiempo.

Qué cambió entre esta instantánea y las posteriores

Los deltas de comportamiento que vale la pena conocer si estás decidiendo si permanecer en la versión fija de lanzamiento o avanzar.

Salidas estructuradas. La instantánea de mayo soporta modo JSON pero no impone esquemas tan estrictamente como la versión de agosto. Los analizadores descendentes que se apoyan en validación de esquemas pueden fallar más a menudo contra esta instantánea.

Calibración de rechazos. El modelo de lanzamiento es más agresivo en ciertos patrones de rechazo que las instantáneas posteriores. Algunos prompts legítimos son rechazados aquí que pasan limpiamente en noviembre.

Razonamiento. La instantánea de noviembre es visiblemente más fuerte en prompts de múltiples pasos. Para cargas de trabajo que prueban calidad de razonamiento, la brecha es material.

Latencia. Las mejoras en la pila de inferencia a lo largo de 2024 significan que la etiqueta flotante ahora sirve la misma clase de modelo con menor latencia que la instantánea de lanzamiento. Fijar a esta fecha significa renunciar a esas mejoras.

Patrón de fijación

El patrón que ha envejecido bien:

Fija en evaluación, CI y cualquier ruta auditada de cumplimiento.
Flota en tráfico de producción.
Diferencia semanalmente entre fijado y flotante contra un conjunto de prompts fijos para capturar la deriva de comportamiento temprano.

Para la instantánea de lanzamiento de mayo de 2024 específicamente, añade: ten un plan de migración documentado a una instantánea más nueva de 4o o a la familia GPT-4.1 antes de que llegue la fecha de depreciación.

Para el contexto más amplio de 4o, consulta la página flotante de GPT-4o. Para la familia más nueva que la mayoría de las nuevas construcciones deberían apuntar, consulta GPT-4.1.

Elegirlo

Usa gpt-4o-2024-05-13 cuando:

Estás reproduciendo un resultado específico vinculado al modelo de lanzamiento.
Un régimen de cumplimiento aprobó este identificador exacto y una re-aprobación está en curso.
Un flujo de trabajo de investigación requiere el comportamiento de referencia de mayo de 2024.

Para todo lo demás, muévete a una instantánea más nueva o a la etiqueta flotante. La instantánea de lanzamiento fue un hito; ya no es el nivel de servicio correcto.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

Comparación de proveedoresLIVE

Comparación de proveedores

Compara cada proveedor de este modelo — coste base, calidad, latencia y disponibilidad.

Azure OpenAI (EU - Sweden)UE

Coste de entrada✓ mejor$2.75

Coste de salida$11.00

CalidadAún sin probar

Latencia (p50)Aún sin probar

DisponibilidadAún sin probar

Costes por 1M de tokens (coste base)

OpenAIEE. UU.Esta oferta

Coste de entrada$5.00

Coste de salida$15.00

Calidad✓ mejor100.0

Latencia (p50)✓ mejor1,695 ms

DisponibilidadAún sin probar

Costes por 1M de tokens (coste base)

Inteligencia de consenso

TODO EL MODELO

Las señales de consenso son de todo el modelo — todavía no por proveedor.

8.0

Utilidad del agente (1–10)

—

Puntuación de precisión

Detecciones únicas

Solicitudes validadas

Gravedad de hallazgos

■ Alta 100%■ Media 0%■ Baja 0%

Votos de la comunidadLIVE

Votos de la comunidad

Lo que opinan los visitantes reales — por proveedor.

Azure OpenAI (EU - Sweden)UE

Aún no hay votos de la comunidad.

OpenAIEE. UU.

Aún no hay votos de la comunidad.

Más resultados — por proveedor

Calidad por categoría

Rúbrica de juego

Aún sin datos.

Veredicto del juez

■ OK 94%■ Parcial 6%■ Incorrecto 0%

Juegos y arena

jugados

victorias

derrotas

20.8 ± 7.2

TrueSkill (μ±σ)

Velocidad y salud

1,695 ms

Latencia (p50)

—

Disponibilidad

Calidad por categoría

Rúbrica de juego

Aún sin datos.

Veredicto del juez

■ OK 94%■ Parcial 6%■ Incorrecto 0%

Juegos y arena

jugados

victorias

derrotas

20.8 ± 7.2

TrueSkill (μ±σ)

Velocidad y salud

1,695 ms

Latencia (p50)

—

Disponibilidad

Pregunta y respuesta — explorarLIVE

1 de 81

🧠 inteligenciaOpenAImultilingual · 2026-07-26puntuación: 100

Bir mağazada %20 indirim uygulanıyor. 150 TL olan bir ürün indirimden sonra kaç TL olur?

150 TL olan bir ürüne %20 indirim uygulandığında, önce indirimin ne kadar olduğunu hesaplamamız gerekiyor. %20 indirim, ürünün fiyatının %20'si kadardır. 150 TL'nin %20'si şu şekilde hesaplanır: \[ 150 \, \text{TL} \times \frac{20}{100} = 150 \, \text{TL} \times 0.20 = 30 \, \text{TL} \] İndirim tutarı 30 TL'dir. Bu tutarı 150 TL'den çıkardığımızda indirimli fiyatı buluruz: \[ 150 \, \text{TL} - 30 \, \text{TL} = 120 \, \text{TL} \] Dolayısıyla, 150 TL olan bir ürün indirimden sonra 120 TL olur.

Historial de pruebas — todos los proveedoresLIVE

Puntuación de calidad en el tiempoúltimo 93

Velocidad — latencia p50 en el tiempo

Aparece una tendencia cuando este modelo se ha probado en varios días distintos.

📝Veredicto — resumenLIVE

Quality decline and latency increase observed across core performance metrics

🖼️Imagen y explicaciónLIVE

gpt-4o-2024-05-13

Capacidades

Por qué importa esta fecha específica

Qué incluye esta instantánea

Riesgo de retirada

Qué cambió entre esta instantánea y las posteriores

Patrón de fijación

Elegirlo

📊Comparación de proveedoresLIVE

🧠Inteligencia de consenso

👥Votos de la comunidadLIVE

🔬Más resultados — por proveedor

💬Pregunta y respuesta — explorarLIVE

🗂️Historial de pruebas — todos los proveedoresLIVE

Veredicto — resumenLIVE

Imagen y explicaciónLIVE

Comparación de proveedoresLIVE

Inteligencia de consenso

Votos de la comunidadLIVE

Más resultados — por proveedor

Pregunta y respuesta — explorarLIVE

Historial de pruebas — todos los proveedoresLIVE