Ir al contenido
Tier C — Especialista
Se ejecuta en:USCreado en:United States
OpenAI

gpt-4o-2024-11-20

Tier C — Especialista

Equipo editorial Tokonomix·Revisado por Mes Kalkan··

GPT-4o-2024-11-20 es un modelo de lenguaje de gran escala desarrollado por OpenAI, lanzado en noviembre de 2024 como parte de la serie GPT-4o. Este modelo representa una iteración de la arquitectura multimodal de OpenAI, aunque en este despliegue funciona principalmente para tareas estándar de generación de texto. Está diseñado para la comprensión y generación de lenguaje de propósito general, incluyendo tareas como creación de contenido, respuesta a preguntas, generación de código, análisis y aplicaciones conversacionales. El modelo se basa en la arquitectura GPT-4 con refinamientos orientados a mejorar la calidad de las respuestas, la coherencia y la capacidad de seguir instrucciones. Si bien OpenAI no ha divulgado detalles técnicos específicos sobre el número de parámetros ni los datos de entrenamiento, el modelo muestra características de rendimiento consistentes con los modelos de lenguaje de frontera. Procesa entradas de texto y genera salidas de texto con capacidades que abarcan múltiples idiomas y dominios del conocimiento, con una fecha de corte de datos de entrenamiento a mediados de 2023. Dentro de la línea de modelos de OpenAI, GPT-4o-2024-11-20 se ubica como una oferta estándar en la familia GPT-4o, posicionada entre los modelos GPT-4 anteriores y los lanzamientos más recientes de OpenAI. La designación "o" en GPT-4o indica optimizaciones para escenarios de despliegue práctico. Esta instantánea particular representa el estado del modelo a la fecha de su lanzamiento en noviembre de 2024, y funciona como el modelo de propósito general recomendado por OpenAI para aplicaciones que requieren una generación de texto confiable sin requisitos especializados de procesamiento multimodal en esta configuración.

GPT-4o de noviembre 2024 representa la iteración más refinada de la serie antes de los lanzamientos de 2025, con mejoras en coherencia y calidad.

Resumen de benchmark Tokonomix
Sección 01

Puntuaciones de calidad

Resultados de evaluación de modelos juez en diversas categorías de tareas. Las puntuaciones reflejan coherencia, precisión y seguimiento de instrucciones.

100
Generación de código
99
Multilingüe
100
Razonamiento
Sección 02

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰
Tarifas API — gpt-4o-2024-11-20
$2.50 por 1M de tokens de entrada
$10.00 por 1M de tokens de salida
≈ $0.0035 por conversación típica (800 tokens)
Precio entrada vs salida (por 1M de tokens)
por 1M de tokens de entrada$2.50
por 1M de tokens de salida$10.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.50

input / 1M

— stable

$10.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Sección 03

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Alta fidelidad en seguimiento de instruccionesSnapshot maduro y estableRazonamiento sólido multi-dominioExcelente generación de códigoAnálisis y síntesis de informaciónSoporte multilingüe robusto

Debilidades

Contexto no documentado en esta versiónVersiones 2025 ofrecen mejoras adicionalesSin audio integrado en versión estándarCorte de conocimiento a mediados de 2023
Sección 04

Capacidades

toolssource: litellmvisionjson modepdf inputjson schemaparallel toolsprompt cachingmax output tokens: 16384
Sección 05

Preguntas frecuentes

Fue ampliamente recomendada en su momento; para nuevos proyectos en 2025 existen versiones más recientes con mejoras.

El snapshot de noviembre 2024 es ampliamente usado en producción por su equilibrio entre calidad y compatibilidad con herramientas existentes.

Resumen de benchmark Tokonomix
Sección 06

Disponibilidad

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 07

Veredictos del benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-595/100 · 76 runs
72 correct4 partial0 wrong95% accuracy
2026-06-14

Comprehensive feature set maintained with stable core capabilities

The gpt-4o-2024-11-20 release maintains the comprehensive capability expansion introduced in the previous window, continuing to support tools, vision, JSON mode, PDF input, JSON schema, parallel tools, and prompt caching. All previously added features remain stable and functional in this iteration. The model continues to offer a robust multi-modal platform suitable for complex enterprise applications requiring structured outputs, document processing, and visual understanding. No new capabilities have been added in this benchmark window, and no existing features have been removed or degraded. Users can expect consistent behavior across all supported modalities. The stability of this release suggests a focus on refinement and reliability rather than feature expansion. Organizations already using the previous version should find migration straightforward with minimal adaptation required. The maintained feature set positions this model as a mature option for production workloads requiring vision understanding, tool use, and structured data handling. This release represents a consolidation period following the significant capability additions of the prior window.

Quality

Latency p50

Test runs

0

All capabilities maintained stable Feature parity with previous release
Sección 08

Perfil completo del modelo

gpt-4o-2024-11-20 — illustration 1
gpt-4o-2024-11-20: la instantánea de 4o de finales de 2024

gpt-4o-2024-11-20 es la última instantánea importante de GPT-4o publicada por OpenAI antes de la llegada de la familia GPT-4.1. Lanzada el 20 de noviembre de 2024, representa al modelo en su forma madura: la misma superficie multimodal que el modelo de lanzamiento, con las mejoras de razonamiento, calidad de escritura y calibración de rechazos que aterrizaron durante la segunda mitad de 2024.

Para los equipos que todavía operan 4o en producción, suele ser el pin correcto. Para nuevos desarrollos, la conversación ya ha avanzado.

Qué cambió en la versión de noviembre

La instantánea de agosto de 2024 acaparó la mayor parte de la atención estructural porque trajo las salidas estructuradas estrictas. La versión de noviembre fue un conjunto de cambios más silenciosos pero igual de relevantes en producción.

Calidad de razonamiento. Noviembre es visiblemente más sólido en prompts de varios pasos que tanto el modelo de lanzamiento como la instantánea de agosto. El trabajo estilo cadena de pensamiento, los prompts de planificación, la síntesis de código nuevo a partir de una especificación vaga: todos muestran una mejora medible. El modelo no está al nivel de los sucesores afinados para razonamiento de la familia GPT-5, pero para la clase 4o fue el punto más alto.

Calidad de escritura. La prosa de formato largo de esta instantánea es notablemente menos rígida que la de la versión de agosto. La estructura de las oraciones varía más, el modelo matiza menos cuando el prompt no lo justifica, y el registro es más consistente entre párrafos. Los equipos que ejecutan redacción de blogs, resúmenes ejecutivos o cualquier generación de texto en producción sobre 4o suelen anclarse a esta instantánea solo por esta razón.

Calibración de rechazos. Algo menos agresiva que agosto en prompts limítrofes. Algunas solicitudes legítimas de caso extremo que la instantánea de agosto rechazaba pasan limpiamente en noviembre.

Qué incluye la instantánea

La superficie completa de funciones de GPT-4o tal como estaba en noviembre de 2024. Entrada de texto e imagen con una ventana de contexto de 128k tokens. El audio aparece a través de la API en tiempo real y los endpoints contemporáneos. Salidas estructuradas estrictas heredadas de agosto. Modo JSON. Llamadas a funciones. Streaming sobre la superficie de Chat Completions.

Lo que no está en esta instantánea es cualquier cosa de la familia GPT-4.1. El contexto de un millón de tokens, las mejoras adicionales de razonamiento, el manejo actualizado del tokenizador: todo permanece en la familia más nueva. Si tu carga de trabajo realmente se beneficia de eso, la conversación de actualización trata sobre familia de modelos, no solo sobre fecha de instantánea.

Por qué los equipos se anclan específicamente a noviembre

La mayoría de los pins de 4o en producción hoy aterrizan en esta fecha o en la etiqueta flotante. Las razones son las habituales.

Regímenes de cumplimiento que aprobaron este identificador. La instantánea de noviembre es lo bastante reciente como para que los ciclos de auditoría completados sobre ella sigan siendo relevantes, lo que la convierte en el 4o anclado más aprobado en entornos regulados.

Pipelines posteriores afinados contra el comportamiento de noviembre. Equipos que construyeron en torno a la calidad de escritura o razonamiento de esta instantánea —generación de contenido, servicios de resumen, bucles de agentes que dependen de los patrones de decisión específicos de noviembre— se anclan para fijar ese comportamiento.

Aplazamiento de migración. Para los equipos que aún no han completado el traslado a GPT-4.1 o GPT-5, anclarse a noviembre les da un objetivo estable mientras el trabajo de migración está en curso. Quedarse flotante en producción mientras se migra es la receta para que los objetivos se muevan en los reportes de evaluación.

Cómo se compara con el estado actual del campo

GPT-4o en la instantánea de noviembre ya no está en la frontera. GPT-4.1, GPT-5, y las familias Claude Opus 4.x y Gemini 3 Pro están todas claramente por delante en razonamiento, trabajo de contexto largo y casos límite de salidas estructuradas.

Lo que 4o sigue teniendo a su favor es una historia de despliegue bien comprendida, un precio más amable que el del nivel frontera, y una superficie de audio a través de gpt-4o-audio y la API en tiempo real que ningún sucesor ha reemplazado por completo para trabajo de voz en producción.

Para la comparación entre categorías ver /benchmarks/leaderboard. Desgloses de velocidad e inteligencia en /benchmarks/speed y /benchmarks/intelligence.

Riesgo de retirada

Esta instantánea es el pin de 4o más reciente y, por tanto, el más alejado de la retirada, pero el horizonte de obsolescencia es finito. Aplica el ciclo típico de OpenAI de doce a dieciocho meses. Planifica en consecuencia.

El sucesor natural del lado de la familia 4o es la etiqueta flotante, que arrastra la mayor parte del comportamiento de noviembre con las pequeñas mejoras posteriores integradas. El movimiento orientado al futuro es hacia GPT-4.1 o GPT-5, según la carga de trabajo. Ten el ciclo de evaluación listo antes de que se anuncie la fecha de retirada.

Patrón de anclaje

El patrón que se sostiene:

  • Anclar en evaluación, CI y flujos de trabajo auditados.
  • Flotar en el tráfico de producción, donde las pequeñas mejoras continuas valen más que la reproducibilidad.
  • Diferenciar semanalmente entre el pin y la versión flotante contra un conjunto fijo de prompts para detectar deriva de comportamiento.

Para noviembre en concreto, la deriva de la etiqueta flotante respecto a esta instantánea es lo bastante pequeña hoy como para que el diff a menudo vuelva limpio. Eso cambia con el tiempo; no dejes que el trabajo de diff se caiga del calendario.

Para la superficie 4o flotante, ver GPT-4o. Para la familia que sustituye a 4o en nuevos desarrollos, ver GPT-4.1.

Cuándo elegirlo

Usa gpt-4o-2024-11-20 cuando:

  • Un régimen de cumplimiento aprobó este identificador y es tu ciclo de auditoría más reciente.
  • Los pipelines posteriores dependen de la calidad de escritura o razonamiento de esta versión específica.
  • Estás ejecutando 4o en producción y quieres un pin estable mientras está en curso una migración a GPT-4.1.

Para nuevos desarrollos, apunta a la familia más nueva. Noviembre fue un buen lugar donde aterrizar. Ya no está al frente de la fila.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

gpt-4o-2024-11-20 — illustration 2
Última prueba automática
14 jun 2026 · 05:06 UTC · Benchmark
Latencia P50
1326 ms
Latencia P95
Errores
0 / 6 ejecuciones
Última revisión por Equipo Tokonomix·26 de mayo de 2026