Ir al contenido
Se ejecuta en:USCreado en:United States
OpenAI

gpt-5.4-nano-2026-03-17

Equipo editorial Tokonomix·Revisado por Mes Kalkan··

GPT-5.4-nano-2026-03-17 es un modelo de generación de texto desarrollado por OpenAI, lanzado en marzo de 2026. Como parte de la serie "nano", este modelo representa una variante más pequeña y eficiente dentro de la familia GPT-5 de OpenAI. Está diseñado para manejar tareas estándar de generación de texto, incluyendo conversación, creación de contenido, resumen y respuesta a preguntas. El modelo procesa entrada de texto y produce respuestas escritas coherentes en una variedad de aplicaciones de propósito general. Esta variante prioriza requisitos computacionales reducidos mientras mantiene capacidades funcionales de generación de texto. La designación "nano" indica que ocupa el nivel inferior de la serie GPT-5 en términos de recuento de parámetros y consumo de recursos, haciéndolo adecuado para aplicaciones donde la eficiencia de implementación es una consideración junto con el rendimiento. El modelo admite técnicas estándar de prompting y puede seguir instrucciones para diversas tareas basadas en texto, aunque sus especificaciones de ventana de contexto no han sido divulgadas públicamente por OpenAI. Dentro de la línea de modelos de OpenAI, GPT-5.4-nano se sitúa por debajo de variantes más grandes como los modelos estándar GPT-5 y GPT-5-turbo. La fecha de lanzamiento de marzo de 2026 sugiere que se trata de una actualización de mitad de generación dentro de la serie GPT-5.4, probablemente incorporando refinamientos a la arquitectura base. Este modelo sirve a usuarios que requieren capacidades básicas a intermedias de generación de texto sin la sobrecarga de modelos más grandes, posicionándolo como una opción accesible para tareas rutinarias de procesamiento de lenguaje.

GPT-5.4 Nano de marzo 2026 es la variante más pequeña y eficiente de la cuarta actualización de GPT-5, optimizada para velocidad en producción de alto volumen.

Resumen de benchmark Tokonomix
Sección 01

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰
Tarifas API — gpt-5.4-nano-2026-03-17
$0.2000 por 1M de tokens de entrada
$1.25 por 1M de tokens de salida
≈ $0.0004 por conversación típica (800 tokens)
Precio entrada vs salida (por 1M de tokens)
por 1M de tokens de entrada$0.2000
por 1M de tokens de salida$1.25

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.2000

input / 1M

— stable

$1.25

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Sección 02

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Máxima velocidad en familia GPT-5.4Mínimo consumo computacionalEscalable para volúmenes masivosSnapshot fijo de marzo 2026Latencia óptima para tiempo realArquitectura GPT-5.4 en tamaño nano

Debilidades

Capacidad de razonamiento muy limitadaContexto no documentadoSolo para tareas sencillasSin capacidad para análisis complejos
Sección 03

Capacidades

toolssource: litellmvisionjson modepdf inputreasoningjson schemaparallel toolsprompt cachingmax output tokens: 128000
Sección 04

Preguntas frecuentes

Hereda los refinamientos acumulados de la serie 5.4 aplicados a la arquitectura nano; mayor precisión en comprensión que versiones nano anteriores.

La arquitectura nano en la serie GPT-5.4 lleva años de mejoras a la categoría de modelos ultra-eficientes para casos de uso básicos.

Resumen de benchmark Tokonomix
Sección 05

Disponibilidad

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 06

Veredictos del benchmark Tokonomix

2026-06-14

Stable release maintains expanded capabilities without performance changes

The gpt-5.4-nano-2026-03-17 release represents a stability update following the previous major capability expansion. This version retains all eight advanced features introduced in the prior window: tools, vision, json_mode, pdf_input, reasoning, json_schema, parallel_tools, and prompt_caching. No benchmark performance data is available for either the current or previous windows, making it impossible to assess quantitative improvements or regressions in accuracy, latency, or other metrics. The model appears to be in a consolidation phase where the focus is on maintaining the newly added functionality rather than introducing additional features or optimizations. Users can expect the same feature set as the previous release, with tools integration for function calling, multimodal vision capabilities, structured output options through JSON modes, PDF processing, enhanced reasoning abilities, and caching optimizations. Without performance benchmarks, the practical impact on real-world tasks remains unclear. Organizations already using the previous version should experience continuity, while new adopters gain access to the full suite of capabilities that were recently introduced.

Quality

Latency p50

Test runs

0

Maintains all eight capabilities Stability-focused release
Sección 07

Perfil completo del modelo

gpt-5.4-nano-2026-03-17 — illustration 1
GPT-5.4 Nano (instantánea 2026-03-17): fijando el nivel más pequeño

Nota — perfil prospectivo. Esta página describe un modelo que está en fase de vista previa temprana, anunciado pero no disponible de forma general, o proyectado en base a señales de la hoja de ruta. Las especificaciones y capacidades pueden cambiar antes del lanzamiento público. Los datos de evaluación en vivo en esta página reflejan el endpoint que nuestra infraestructura de pruebas puede alcanzar hoy.

Esta es la instantánea fechada de GPT-5.4 Nano, congelada en el lanzamiento del 17 de marzo de 2026. El slug flotante gpt-5.4-nano continúa moviéndose. Fijar el nivel nano es la misma disciplina operacional que fijar cualquier otro nivel, con un matiz importante: los niveles más pequeños tienden a tener las ventanas de obsolescencia más cortas.

El riesgo de obsolescencia que golpea más duramente a nano

El patrón de obsolescencia de OpenAI a través de generaciones de modelos ha sido consistente: las instantáneas fechadas quedan obsoletas según un calendario publicado, generalmente uno o dos años después del lanzamiento, a veces más rápido. Los plazos publicados se aplican a todas las instantáneas, pero la presión práctica sobre operar instantáneas antiguas difiere según el nivel.

Los niveles más grandes tienden a envejecer con más elegancia. Una instantánea base o Pro de hace un año todavía realiza trabajo útil para la mayoría de las tareas; la brecha con las instantáneas actuales es real pero absorbible para muchas cargas de trabajo. Los equipos que utilizan esos niveles en producción a menudo tienen tiempo para migrar cuidadosamente cuando se anuncia la obsolescencia.

Los niveles más pequeños envejecen con menos elegancia. Las mejoras de Nano entre generaciones han sido sustanciales, y la brecha entre el nano de hoy y el nano del año pasado en la misma carga de trabajo suele ser mayor que la brecha equivalente en el nivel base. Cuando una instantánea nano queda obsoleta, es más probable que la migración implique una reingeniería significativa de prompts y ajustes en los pipelines descendentes porque los cambios de comportamiento entre generaciones son mayores.

Esto no es una razón para omitir la fijación en el nivel nano. Es una razón para instrumentar la fijación con más cuidado y planificar la migración con mayor antelación.

Qué captura esta instantánea

El lanzamiento de marzo de 2026 de GPT-5.4 Nano: pesos de lanzamiento, comportamiento de lanzamiento en clasificación y tareas simples de extracción, perfil de latencia de lanzamiento, configuración del codificador de visión de lanzamiento para la clase de tamaño.

Las mejoras que 5.4 aporta sobre los niveles nano anteriores — mejor precisión de clasificación en problemas multiclase, manejo más ajustado de salidas estructuradas cortas, calidad mejorada de completado por pulsación de tecla — están todas capturadas en la forma de lanzamiento. Los refinamientos posteriores del slug flotante no aparecen aquí.

Bajo el capó

Arquitectónicamente este es el decodificador transformer de GPT-5.4 Nano que acepta entradas de texto e imagen intercaladas, con salida solo de texto. OpenAI no ha publicado los recuentos de parámetros. La capacidad de visión está presente pero notablemente más débil que los niveles más grandes — lectura estándar de gráficos y trabajo OCR funcionan, diagramas complejos y diseños adversariales a menudo no.

La tokenización utiliza el vocabulario BPE estándar de GPT-5. La ventana de contexto es más corta que los niveles más grandes en términos absolutos, y la coherencia cae mucho antes del límite nominal. El corte de entrenamiento se sitúa a principios de 2026.

Los perfiles de coste por token y latencia por solicitud están bloqueados en los valores de lanzamiento. Estos son los que hacen viable a nano para cargas de trabajo de alto volumen, y son parte de lo que estás fijando cuando fijas esta instantánea.

Dónde se sitúa hoy

Frente a las ofertas actuales de nivel más pequeño, la instantánea de marzo de 2026 de GPT-5.4 Nano es competitiva en clasificación, extracción simple y salida estructurada de formato corto. La tabla de clasificación de inteligencia rastrea la posición comparativa entre niveles; espera que la brecha con un nano de slug flotante actual crezca con el tiempo a medida que la familia continúa evolucionando.

Para extracción de datos en el extremo simple — extrayendo campos nombrados específicos con ubicaciones predecibles — la instantánea maneja el trabajo con ahorros de coste significativos sobre los niveles más grandes. Para flujos de trabajo de contenido en el extremo de formato corto (líneas de asunto, texto de botones, resúmenes de una sola oración), la instantánea suele ser suficiente por sí misma.

Cuándo fijar esta instantánea

Los casos se superponen con el argumento más amplio de fijación pero se agudizan por el perfil de alto volumen de nano:

Tienes pipelines automatizados que consumen salida de nano y esperan formato específico. La fijación previene que la deriva silenciosa del formato rompa los analizadores descendentes.

Has evaluado esta instantánea contra tu carga de trabajo específica y tienes prompts, ejemplos few-shot y umbrales de calidad calibrados a su comportamiento. Reajustar a través de una migración de instantánea cuesta tiempo de ingeniería y arriesga regresiones sutiles.

Estás ejecutando cargas de trabajo de clasificación o extracción donde los cambios en la distribución de salida tienen consecuencias descendentes medibles — decisiones de enrutamiento, umbrales de alerta, categorización automática que alimenta métricas de negocio.

Estás en un contexto regulado donde cualquier modelo que toque decisiones de cara al cliente debe ser identificable en auditoría a una versión específica.

El argumento de planificación de obsolescencia

Más allá de las razones estándar de fijación, el argumento específico de nano trata sobre la planificación de obsolescencia. Debido a que las instantáneas nano tienden a ver cambios de comportamiento más grandes entre generaciones que los niveles más grandes, la migración desde esta instantánea a su eventual sucesora probablemente implicará más trabajo que la migración equivalente en base o Pro.

Fijar esta instantánea ahora y tratar la eventual migración como un proyecto planificado — con evaluación, reajuste de prompts, ajuste de pipeline y pruebas de rollback — es significativamente diferente de derivar del slug flotante y descubrir después del hecho que algo cambió. La fijación te da la fecha para planificar. El slug flotante te da incidentes a los que reaccionar.

Cuando OpenAI publique el cronograma de obsolescencia para esta instantánea, trata la fecha como un plazo de proyecto firme. Presupuesta el trabajo de migración. Ejecuta la evaluación contra la siguiente instantánea mucho antes del día de obsolescencia, no después.

Dónde permanecen los límites

Los límites de capacidad de nano se aplican igualmente a esta instantánea. El razonamiento es superficial. La coherencia de contexto largo es pobre. La salida estructurada funciona en esquemas simples y falla en los complejos. La alucinación en temas de nicho es mayor que en los niveles más grandes.

Ninguno de estos cambia con la fijación. Estás fijando el comportamiento de lanzamiento de un modelo de nivel más pequeño. Las cargas de trabajo que ya han aceptado esos límites a cambio del perfil de coste y latencia son las cargas de trabajo que se benefician de la fijación.

Alternativas

Para cargas de trabajo que necesitan comportamiento fijado de nivel más pequeño en una familia de modelos diferente, las ofertas equivalentes a nano comparables de Anthropic y Google también se envían con instantáneas fechadas. El patrón de fijación es estándar de la industria en este nivel.

Para cargas de trabajo donde el perfil de coste y latencia de nano es necesario pero el comportamiento específico de OpenAI no lo es, pequeños clasificadores de pesos abiertos ejecutándose en tu propia infraestructura te dan la historia de residencia y la previsibilidad operacional que los slugs flotantes no pueden. El coste de configuración es significativo pero el perfil operacional a largo plazo es más estable.

Para cargas de trabajo donde la reproducibilidad importa pero nano no es capacidad suficiente, fija una instantánea fechada mini o base de la línea 5.4 en su lugar.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

gpt-5.4-nano-2026-03-17 — illustration 2
Última prueba automática
14 jun 2026 · 04:54 UTC · Benchmark
Latencia P50
Latencia P95
Errores
1 / 6 ejecuciones
Última revisión por Equipo Tokonomix·26 de mayo de 2026