Tier C — Especialista

Se ejecuta en:USCreado en:United States

$10.00

salida · por 1M de tokens (coste base)

Coste

1,003 ms

Velocidad de respuesta

100 / 100

Inteligencia

Veredicto — resumenLIVE

● LIVE

ahora · 2026-07-26

Quality decline and slower responses across tested categories

✗ Quality dropped 6.8 points✗ Latency increased 46%✓ Multilingual remains at 100✗ Creative performance declined

This benchmark window reveals a significant performance regression for gpt-4o-2024-11-20. Overall quality dropped 6.8 points from 99.3 to 92.5, while latency increased by 46% with median response times rising from 1253ms to 1825ms. The category composition changed between windows, making direct comparisons limited, but the available data shows mixed results. Multilingual capabilities remained exceptional at 100 in both windows, demonstrating consistent strength in language handling. However, creative tasks scored 87 compared to the previous 98, indicating a notable decline in this area. Reasoning achieved a perfect 100 score, while factual performance registered at 83. The previous window's perfect coding score of 100 cannot be compared as coding was not tested in the current window. The substantial latency increase is particularly concerning for real-time applications, representing nearly half a second of additional wait time per request. Users should be aware that this version shows reduced creative capability and slower response times compared to the previous benchmark period, though multilingual and reasoning performance remain strong areas.

Quality

92.5

Latency p50

1,825 ms

Test runs

1 de 15

Imagen y explicaciónLIVE

OpenAI

gpt-4o-2024-11-20

Tier C — Especialista

Equipo editorial Tokonomix·Revisado por Mes Kalkan·Publicado 22 de mayo de 2026·Última revisión 26 de mayo de 2026

GPT-4o-2024-11-20 es un modelo de lenguaje de gran escala desarrollado por OpenAI, lanzado en noviembre de 2024 como parte de la serie GPT-4o. Este modelo representa una iteración de la arquitectura multimodal de OpenAI, aunque en este despliegue funciona principalmente para tareas estándar de generación de texto. Está diseñado para la comprensión y generación de lenguaje de propósito general, incluyendo tareas como creación de contenido, respuesta a preguntas, generación de código, análisis y aplicaciones conversacionales. El modelo se basa en la arquitectura GPT-4 con refinamientos orientados a mejorar la calidad de las respuestas, la coherencia y la capacidad de seguir instrucciones. Si bien OpenAI no ha divulgado detalles técnicos específicos sobre el número de parámetros ni los datos de entrenamiento, el modelo muestra características de rendimiento consistentes con los modelos de lenguaje de frontera. Procesa entradas de texto y genera salidas de texto con capacidades que abarcan múltiples idiomas y dominios del conocimiento, con una fecha de corte de datos de entrenamiento a mediados de 2023. Dentro de la línea de modelos de OpenAI, GPT-4o-2024-11-20 se ubica como una oferta estándar en la familia GPT-4o, posicionada entre los modelos GPT-4 anteriores y los lanzamientos más recientes de OpenAI. La designación "o" en GPT-4o indica optimizaciones para escenarios de despliegue práctico. Esta instantánea particular representa el estado del modelo a la fecha de su lanzamiento en noviembre de 2024, y funciona como el modelo de propósito general recomendado por OpenAI para aplicaciones que requieren una generación de texto confiable sin requisitos especializados de procesamiento multimodal en esta configuración.

GPT-4o de noviembre 2024 representa la iteración más refinada de la serie antes de los lanzamientos de 2025, con mejoras en coherencia y calidad.
— Resumen de benchmark Tokonomix

Capacidades

toolssource: litellmvisionjson modepdf inputjson schemaparallel toolsprompt cachingmax output tokens: 16384

gpt-4o-2024-11-20: la instantánea de 4o de finales de 2024

gpt-4o-2024-11-20 es la última instantánea importante de GPT-4o publicada por OpenAI antes de la llegada de la familia GPT-4.1. Lanzada el 20 de noviembre de 2024, representa al modelo en su forma madura: la misma superficie multimodal que el modelo de lanzamiento, con las mejoras de razonamiento, calidad de escritura y calibración de rechazos que aterrizaron durante la segunda mitad de 2024.

Para los equipos que todavía operan 4o en producción, suele ser el pin correcto. Para nuevos desarrollos, la conversación ya ha avanzado.

Qué cambió en la versión de noviembre

La instantánea de agosto de 2024 acaparó la mayor parte de la atención estructural porque trajo las salidas estructuradas estrictas. La versión de noviembre fue un conjunto de cambios más silenciosos pero igual de relevantes en producción.

Calidad de razonamiento. Noviembre es visiblemente más sólido en prompts de varios pasos que tanto el modelo de lanzamiento como la instantánea de agosto. El trabajo estilo cadena de pensamiento, los prompts de planificación, la síntesis de código nuevo a partir de una especificación vaga: todos muestran una mejora medible. El modelo no está al nivel de los sucesores afinados para razonamiento de la familia GPT-5, pero para la clase 4o fue el punto más alto.

Calidad de escritura. La prosa de formato largo de esta instantánea es notablemente menos rígida que la de la versión de agosto. La estructura de las oraciones varía más, el modelo matiza menos cuando el prompt no lo justifica, y el registro es más consistente entre párrafos. Los equipos que ejecutan redacción de blogs, resúmenes ejecutivos o cualquier generación de texto en producción sobre 4o suelen anclarse a esta instantánea solo por esta razón.

Calibración de rechazos. Algo menos agresiva que agosto en prompts limítrofes. Algunas solicitudes legítimas de caso extremo que la instantánea de agosto rechazaba pasan limpiamente en noviembre.

Qué incluye la instantánea

La superficie completa de funciones de GPT-4o tal como estaba en noviembre de 2024. Entrada de texto e imagen con una ventana de contexto de 128k tokens. El audio aparece a través de la API en tiempo real y los endpoints contemporáneos. Salidas estructuradas estrictas heredadas de agosto. Modo JSON. Llamadas a funciones. Streaming sobre la superficie de Chat Completions.

Lo que no está en esta instantánea es cualquier cosa de la familia GPT-4.1. El contexto de un millón de tokens, las mejoras adicionales de razonamiento, el manejo actualizado del tokenizador: todo permanece en la familia más nueva. Si tu carga de trabajo realmente se beneficia de eso, la conversación de actualización trata sobre familia de modelos, no solo sobre fecha de instantánea.

Por qué los equipos se anclan específicamente a noviembre

La mayoría de los pins de 4o en producción hoy aterrizan en esta fecha o en la etiqueta flotante. Las razones son las habituales.

Regímenes de cumplimiento que aprobaron este identificador. La instantánea de noviembre es lo bastante reciente como para que los ciclos de auditoría completados sobre ella sigan siendo relevantes, lo que la convierte en el 4o anclado más aprobado en entornos regulados.

Pipelines posteriores afinados contra el comportamiento de noviembre. Equipos que construyeron en torno a la calidad de escritura o razonamiento de esta instantánea —generación de contenido, servicios de resumen, bucles de agentes que dependen de los patrones de decisión específicos de noviembre— se anclan para fijar ese comportamiento.

Aplazamiento de migración. Para los equipos que aún no han completado el traslado a GPT-4.1 o GPT-5, anclarse a noviembre les da un objetivo estable mientras el trabajo de migración está en curso. Quedarse flotante en producción mientras se migra es la receta para que los objetivos se muevan en los reportes de evaluación.

Cómo se compara con el estado actual del campo

GPT-4o en la instantánea de noviembre ya no está en la frontera. GPT-4.1, GPT-5, y las familias Claude Opus 4.x y Gemini 3 Pro están todas claramente por delante en razonamiento, trabajo de contexto largo y casos límite de salidas estructuradas.

Lo que 4o sigue teniendo a su favor es una historia de despliegue bien comprendida, un precio más amable que el del nivel frontera, y una superficie de audio a través de gpt-4o-audio y la API en tiempo real que ningún sucesor ha reemplazado por completo para trabajo de voz en producción.

Para la comparación entre categorías ver /benchmarks/leaderboard. Desgloses de velocidad e inteligencia en /benchmarks/speed y /benchmarks/intelligence.

Riesgo de retirada

Esta instantánea es el pin de 4o más reciente y, por tanto, el más alejado de la retirada, pero el horizonte de obsolescencia es finito. Aplica el ciclo típico de OpenAI de doce a dieciocho meses. Planifica en consecuencia.

El sucesor natural del lado de la familia 4o es la etiqueta flotante, que arrastra la mayor parte del comportamiento de noviembre con las pequeñas mejoras posteriores integradas. El movimiento orientado al futuro es hacia GPT-4.1 o GPT-5, según la carga de trabajo. Ten el ciclo de evaluación listo antes de que se anuncie la fecha de retirada.

Patrón de anclaje

El patrón que se sostiene:

Anclar en evaluación, CI y flujos de trabajo auditados.
Flotar en el tráfico de producción, donde las pequeñas mejoras continuas valen más que la reproducibilidad.
Diferenciar semanalmente entre el pin y la versión flotante contra un conjunto fijo de prompts para detectar deriva de comportamiento.

Para noviembre en concreto, la deriva de la etiqueta flotante respecto a esta instantánea es lo bastante pequeña hoy como para que el diff a menudo vuelva limpio. Eso cambia con el tiempo; no dejes que el trabajo de diff se caiga del calendario.

Para la superficie 4o flotante, ver GPT-4o. Para la familia que sustituye a 4o en nuevos desarrollos, ver GPT-4.1.

Cuándo elegirlo

Usa gpt-4o-2024-11-20 cuando:

Un régimen de cumplimiento aprobó este identificador y es tu ciclo de auditoría más reciente.
Los pipelines posteriores dependen de la calidad de escritura o razonamiento de esta versión específica.
Estás ejecutando 4o en producción y quieres un pin estable mientras está en curso una migración a GPT-4.1.

Para nuevos desarrollos, apunta a la familia más nueva. Noviembre fue un buen lugar donde aterrizar. Ya no está al frente de la fila.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

Comparación de proveedoresLIVE

Comparación de proveedores

Compara cada proveedor de este modelo — coste base, calidad, latencia y disponibilidad.

Azure OpenAI (EU - Sweden)UE

Coste de entrada$2.75

Coste de salida$11.00

CalidadAún sin probar

Latencia (p50)Aún sin probar

DisponibilidadAún sin probar

Costes por 1M de tokens (coste base)

OpenAIEE. UU.Esta oferta

Coste de entrada✓ mejor$2.50

Coste de salida$10.00

Calidad✓ mejor100.0

Latencia (p50)✓ mejor1,003 ms

DisponibilidadAún sin probar

Costes por 1M de tokens (coste base)

Inteligencia de consenso

TODO EL MODELO

Las señales de consenso son de todo el modelo — todavía no por proveedor.

8.0

Utilidad del agente (1–10)

—

Puntuación de precisión

Detecciones únicas

Solicitudes validadas

Gravedad de hallazgos

■ Alta 100%■ Media 0%■ Baja 0%

Votos de la comunidadLIVE

Votos de la comunidad

Lo que opinan los visitantes reales — por proveedor.

Azure OpenAI (EU - Sweden)UE

Aún no hay votos de la comunidad.

OpenAIEE. UU.

Aún no hay votos de la comunidad.

Más resultados — por proveedor

Calidad por categoría

Rúbrica de juego

Aún sin datos.

Veredicto del juez

■ OK 95%■ Parcial 5%■ Incorrecto 0%

Juegos y arena

Aún sin datos.

Velocidad y salud

1,003 ms

Latencia (p50)

—

Disponibilidad

Calidad por categoría

Rúbrica de juego

Aún sin datos.

Veredicto del juez

■ OK 95%■ Parcial 5%■ Incorrecto 0%

Juegos y arena

Aún sin datos.

Velocidad y salud

1,003 ms

Latencia (p50)

—

Disponibilidad

Pregunta y respuesta — explorarLIVE

1 de 80

🧠 inteligenciaOpenAImultilingual · 2026-07-26puntuación: 100

Bir mağazada %20 indirim uygulanıyor. 150 TL olan bir ürün indirimden sonra kaç TL olur?

Bir ürünün indirimli fiyatını hesaplamak için şu adımları izleyebiliriz: 1. **Ürünün indirime tabi olan miktarını hesaplayalım:** %20 indirim demek, ürün fiyatının %20'si kadar bir miktarın fiyatından düşüleceği anlamına gelir. 150 TL'nin %20'si: $ 150 \times 0,20 = 30 \, TL $ 2. **Ürünün indirimli fiyatını bulalım:** $ 150 - 30 = 120 \, TL $ Sonuç: İndirimden sonra ürünün fiyatı **120 TL** olur. 🙂

Historial de pruebas — todos los proveedoresLIVE

Puntuación de calidad en el tiempoúltimo 91

Velocidad — latencia p50 en el tiempo

Aparece una tendencia cuando este modelo se ha probado en varios días distintos.

📝Veredicto — resumenLIVE

Quality decline and slower responses across tested categories

🖼️Imagen y explicaciónLIVE

gpt-4o-2024-11-20

Capacidades

Qué cambió en la versión de noviembre

Qué incluye la instantánea

Por qué los equipos se anclan específicamente a noviembre

Cómo se compara con el estado actual del campo

Riesgo de retirada

Patrón de anclaje

Cuándo elegirlo

📊Comparación de proveedoresLIVE

🧠Inteligencia de consenso

👥Votos de la comunidadLIVE

🔬Más resultados — por proveedor

💬Pregunta y respuesta — explorarLIVE

🗂️Historial de pruebas — todos los proveedoresLIVE

Veredicto — resumenLIVE

Imagen y explicaciónLIVE

Comparación de proveedoresLIVE

Inteligencia de consenso

Votos de la comunidadLIVE

Más resultados — por proveedor

Pregunta y respuesta — explorarLIVE

Historial de pruebas — todos los proveedoresLIVE