¿El snapshot de marzo 2026 tiene ventajas específicas?

Incorpora el estado de desarrollo de GPT-5.4 en ese momento; útil para equipos que necesitan referencia temporal fija.

¿Puede usarse para clasificación de documentos?

Sí, para clasificación de textos cortos y enrutamiento básico de consultas es una opción eficiente.

¿Cómo se compara en velocidad con nano de GPT-4.1?

La serie GPT-5.4 nano debería ofrecer mejor comprensión que GPT-4.1 nano con latencias comparables por el mismo tamaño.

Tier A — Frontera

Se ejecuta en:USCreado en:United States

OpenAI

gpt-5.4-nano-2026-03-17

Tier A — Frontera

Equipo editorial Tokonomix·Revisado por Mes Kalkan·Publicado 22 de mayo de 2026·Última revisión 26 de mayo de 2026

GPT-5.4-nano-2026-03-17 es un modelo de generación de texto desarrollado por OpenAI, lanzado en marzo de 2026. Como parte de la serie "nano", este modelo representa una variante más pequeña y eficiente dentro de la familia GPT-5 de OpenAI. Está diseñado para manejar tareas estándar de generación de texto, incluyendo conversación, creación de contenido, resumen y respuesta a preguntas. El modelo procesa entrada de texto y produce respuestas escritas coherentes en una variedad de aplicaciones de propósito general. Esta variante prioriza requisitos computacionales reducidos mientras mantiene capacidades funcionales de generación de texto. La designación "nano" indica que ocupa el nivel inferior de la serie GPT-5 en términos de recuento de parámetros y consumo de recursos, haciéndolo adecuado para aplicaciones donde la eficiencia de implementación es una consideración junto con el rendimiento. El modelo admite técnicas estándar de prompting y puede seguir instrucciones para diversas tareas basadas en texto, aunque sus especificaciones de ventana de contexto no han sido divulgadas públicamente por OpenAI. Dentro de la línea de modelos de OpenAI, GPT-5.4-nano se sitúa por debajo de variantes más grandes como los modelos estándar GPT-5 y GPT-5-turbo. La fecha de lanzamiento de marzo de 2026 sugiere que se trata de una actualización de mitad de generación dentro de la serie GPT-5.4, probablemente incorporando refinamientos a la arquitectura base. Este modelo sirve a usuarios que requieren capacidades básicas a intermedias de generación de texto sin la sobrecarga de modelos más grandes, posicionándolo como una opción accesible para tareas rutinarias de procesamiento de lenguaje.

GPT-5.4 Nano de marzo 2026 es la variante más pequeña y eficiente de la cuarta actualización de GPT-5, optimizada para velocidad en producción de alto volumen.
— Resumen de benchmark Tokonomix

Sección 01

Puntuaciones de calidad

Resultados de evaluación de modelos juez en diversas categorías de tareas. Las puntuaciones reflejan coherencia, precisión y seguimiento de instrucciones.

Creativo

Factual

100

Multilingüe

100

Razonamiento

Sección 02

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰

Tarifas API — gpt-5.4-nano-2026-03-17

$0.2000 por 1M de tokens de entrada

$1.25 por 1M de tokens de salida

≈ $0.0004 por conversación típica (800 tokens)

Precio entrada vs salida (por 1M de tokens)

por 1M de tokens de entrada$0.2000

por 1M de tokens de salida$1.25

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.2000

input / 1M

— stable

$1.25

output / 1M

— stable

2026-05-242026-07-052026-07-26

Input

Output

Price change

⟳ synced weekly

Sección 03

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Máxima velocidad en familia GPT-5.4Mínimo consumo computacionalEscalable para volúmenes masivosSnapshot fijo de marzo 2026Latencia óptima para tiempo realArquitectura GPT-5.4 en tamaño nano

Debilidades

Capacidad de razonamiento muy limitadaContexto no documentadoSolo para tareas sencillasSin capacidad para análisis complejos

Sección 04

Capacidades

toolssource: litellmvisionjson modepdf inputreasoningjson schemaparallel toolsprompt cachingmax output tokens: 128000

Sección 05

Preguntas frecuentes

Hereda los refinamientos acumulados de la serie 5.4 aplicados a la arquitectura nano; mayor precisión en comprensión que versiones nano anteriores.

La arquitectura nano en la serie GPT-5.4 lleva años de mejoras a la categoría de modelos ultra-eficientes para casos de uso básicos.
— Resumen de benchmark Tokonomix

Sección 06

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 07

Veredictos del benchmark Tokonomix

⚖️

Endorsed by 2 judges

Independent LLM judges evaluated this model on our weekly intelligence tests

cohere/command-a100/100 · 1 runs

1 correct0 partial0 wrong100% accuracy

claude-sonnet-4-598/100 · 20 runs

19 correct1 partial0 wrong95% accuracy

● 2026-07-26

Quality decline and significant latency regression detected

This benchmark window reveals concerning performance degradation for gpt-5.4-nano-2026-03-17. The overall quality score dropped 6.2 points from 99.3 to 93.1, while latency increased by 73 percent from 1354ms to 2345ms at the median. The category results show a mixed picture with reasoning and multilingual capabilities maintaining perfect scores of 100. However, creative performance fell sharply to 81 from the previous window's 98, representing a 17-point decline and the lowest score among tracked categories. Factual accuracy scored 92, though no prior comparison is available for this category. The coding category, which scored perfectly in the previous window, was not evaluated in the current test run. With only 5 test runs in each window, these results suggest either a model update, infrastructure changes, or potential deployment issues affecting both response quality and speed. Users should expect noticeably slower responses and may experience reduced quality in creative tasks. The strong performance in reasoning and multilingual tasks remains a positive indicator, but the overall regression warrants attention from both users and the development team.

Quality

93.1

Latency p50

2,345 ms

Test runs

✗ Quality dropped 6.2 points✗ Latency increased 73%✗ Creative score fell to 81✓ Reasoning maintains perfect score

Sección 08

Perfil completo del modelo

GPT-5.4 Nano (instantánea 2026-03-17): fijando el nivel más pequeño

Nota — perfil prospectivo. Esta página describe un modelo que está en fase de vista previa temprana, anunciado pero no disponible de forma general, o proyectado en base a señales de la hoja de ruta. Las especificaciones y capacidades pueden cambiar antes del lanzamiento público. Los datos de evaluación en vivo en esta página reflejan el endpoint que nuestra infraestructura de pruebas puede alcanzar hoy.

Esta es la instantánea fechada de GPT-5.4 Nano, congelada en el lanzamiento del 17 de marzo de 2026. El slug flotante gpt-5.4-nano continúa moviéndose. Fijar el nivel nano es la misma disciplina operacional que fijar cualquier otro nivel, con un matiz importante: los niveles más pequeños tienden a tener las ventanas de obsolescencia más cortas.

El riesgo de obsolescencia que golpea más duramente a nano

El patrón de obsolescencia de OpenAI a través de generaciones de modelos ha sido consistente: las instantáneas fechadas quedan obsoletas según un calendario publicado, generalmente uno o dos años después del lanzamiento, a veces más rápido. Los plazos publicados se aplican a todas las instantáneas, pero la presión práctica sobre operar instantáneas antiguas difiere según el nivel.

Los niveles más grandes tienden a envejecer con más elegancia. Una instantánea base o Pro de hace un año todavía realiza trabajo útil para la mayoría de las tareas; la brecha con las instantáneas actuales es real pero absorbible para muchas cargas de trabajo. Los equipos que utilizan esos niveles en producción a menudo tienen tiempo para migrar cuidadosamente cuando se anuncia la obsolescencia.

Los niveles más pequeños envejecen con menos elegancia. Las mejoras de Nano entre generaciones han sido sustanciales, y la brecha entre el nano de hoy y el nano del año pasado en la misma carga de trabajo suele ser mayor que la brecha equivalente en el nivel base. Cuando una instantánea nano queda obsoleta, es más probable que la migración implique una reingeniería significativa de prompts y ajustes en los pipelines descendentes porque los cambios de comportamiento entre generaciones son mayores.

Esto no es una razón para omitir la fijación en el nivel nano. Es una razón para instrumentar la fijación con más cuidado y planificar la migración con mayor antelación.

Qué captura esta instantánea

El lanzamiento de marzo de 2026 de GPT-5.4 Nano: pesos de lanzamiento, comportamiento de lanzamiento en clasificación y tareas simples de extracción, perfil de latencia de lanzamiento, configuración del codificador de visión de lanzamiento para la clase de tamaño.

Las mejoras que 5.4 aporta sobre los niveles nano anteriores — mejor precisión de clasificación en problemas multiclase, manejo más ajustado de salidas estructuradas cortas, calidad mejorada de completado por pulsación de tecla — están todas capturadas en la forma de lanzamiento. Los refinamientos posteriores del slug flotante no aparecen aquí.

Bajo el capó

Arquitectónicamente este es el decodificador transformer de GPT-5.4 Nano que acepta entradas de texto e imagen intercaladas, con salida solo de texto. OpenAI no ha publicado los recuentos de parámetros. La capacidad de visión está presente pero notablemente más débil que los niveles más grandes — lectura estándar de gráficos y trabajo OCR funcionan, diagramas complejos y diseños adversariales a menudo no.

La tokenización utiliza el vocabulario BPE estándar de GPT-5. La ventana de contexto es más corta que los niveles más grandes en términos absolutos, y la coherencia cae mucho antes del límite nominal. El corte de entrenamiento se sitúa a principios de 2026.

Los perfiles de coste por token y latencia por solicitud están bloqueados en los valores de lanzamiento. Estos son los que hacen viable a nano para cargas de trabajo de alto volumen, y son parte de lo que estás fijando cuando fijas esta instantánea.

Dónde se sitúa hoy

Frente a las ofertas actuales de nivel más pequeño, la instantánea de marzo de 2026 de GPT-5.4 Nano es competitiva en clasificación, extracción simple y salida estructurada de formato corto. La tabla de clasificación de inteligencia rastrea la posición comparativa entre niveles; espera que la brecha con un nano de slug flotante actual crezca con el tiempo a medida que la familia continúa evolucionando.

Para extracción de datos en el extremo simple — extrayendo campos nombrados específicos con ubicaciones predecibles — la instantánea maneja el trabajo con ahorros de coste significativos sobre los niveles más grandes. Para flujos de trabajo de contenido en el extremo de formato corto (líneas de asunto, texto de botones, resúmenes de una sola oración), la instantánea suele ser suficiente por sí misma.

Cuándo fijar esta instantánea

Los casos se superponen con el argumento más amplio de fijación pero se agudizan por el perfil de alto volumen de nano:

Tienes pipelines automatizados que consumen salida de nano y esperan formato específico. La fijación previene que la deriva silenciosa del formato rompa los analizadores descendentes.

Has evaluado esta instantánea contra tu carga de trabajo específica y tienes prompts, ejemplos few-shot y umbrales de calidad calibrados a su comportamiento. Reajustar a través de una migración de instantánea cuesta tiempo de ingeniería y arriesga regresiones sutiles.

Estás ejecutando cargas de trabajo de clasificación o extracción donde los cambios en la distribución de salida tienen consecuencias descendentes medibles — decisiones de enrutamiento, umbrales de alerta, categorización automática que alimenta métricas de negocio.

Estás en un contexto regulado donde cualquier modelo que toque decisiones de cara al cliente debe ser identificable en auditoría a una versión específica.

El argumento de planificación de obsolescencia

Más allá de las razones estándar de fijación, el argumento específico de nano trata sobre la planificación de obsolescencia. Debido a que las instantáneas nano tienden a ver cambios de comportamiento más grandes entre generaciones que los niveles más grandes, la migración desde esta instantánea a su eventual sucesora probablemente implicará más trabajo que la migración equivalente en base o Pro.

Fijar esta instantánea ahora y tratar la eventual migración como un proyecto planificado — con evaluación, reajuste de prompts, ajuste de pipeline y pruebas de rollback — es significativamente diferente de derivar del slug flotante y descubrir después del hecho que algo cambió. La fijación te da la fecha para planificar. El slug flotante te da incidentes a los que reaccionar.

Cuando OpenAI publique el cronograma de obsolescencia para esta instantánea, trata la fecha como un plazo de proyecto firme. Presupuesta el trabajo de migración. Ejecuta la evaluación contra la siguiente instantánea mucho antes del día de obsolescencia, no después.

Dónde permanecen los límites

Los límites de capacidad de nano se aplican igualmente a esta instantánea. El razonamiento es superficial. La coherencia de contexto largo es pobre. La salida estructurada funciona en esquemas simples y falla en los complejos. La alucinación en temas de nicho es mayor que en los niveles más grandes.

Ninguno de estos cambia con la fijación. Estás fijando el comportamiento de lanzamiento de un modelo de nivel más pequeño. Las cargas de trabajo que ya han aceptado esos límites a cambio del perfil de coste y latencia son las cargas de trabajo que se benefician de la fijación.

Alternativas

Para cargas de trabajo que necesitan comportamiento fijado de nivel más pequeño en una familia de modelos diferente, las ofertas equivalentes a nano comparables de Anthropic y Google también se envían con instantáneas fechadas. El patrón de fijación es estándar de la industria en este nivel.

Para cargas de trabajo donde el perfil de coste y latencia de nano es necesario pero el comportamiento específico de OpenAI no lo es, pequeños clasificadores de pesos abiertos ejecutándose en tu propia infraestructura te dan la historia de residencia y la previsibilidad operacional que los slugs flotantes no pueden. El coste de configuración es significativo pero el perfil operacional a largo plazo es más estable.

Para cargas de trabajo donde la reproducibilidad importa pero nano no es capacidad suficiente, fija una instantánea fechada mini o base de la línea 5.4 en su lugar.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

Última prueba automática

26 jul 2026 · 05:28 UTC · Benchmark

Latencia P50

1461 ms

Latencia P95

—

Errores

0 / 6 ejecuciones

Última revisión por Equipo Tokonomix·26 de mayo de 2026