
GPT-5 Nano es el modelo de nivel más pequeño del lanzamiento original de GPT-5. Ha impulsado innumerables tuberías de clasificación de alto volumen, etapas de prefiltrado, rutas de autocompletado y flujos de extracción simple desde su lanzamiento. El slug es flotante, lo que significa que cualquiera que lo lea hoy está obteniendo los pesos que OpenAI considera actualmente el gpt-5-nano recomendado — silenciosamente distinto de lo que apuntaba el slug hace un año.
El problema combinado de slug flotante y envejecimiento
Un slug flotante en el nivel más pequeño es operativamente el peor caso. Nano transporta el tráfico de mayor volumen en la mayoría de los stacks, lo que significa que cualquier deriva de comportamiento afecta al mayor número de salidas. El problema de envejecimiento también se aplica aquí — las mejoras de nano entre generaciones han sido sustanciales, por lo que el modelo que corre hoy en gpt-5-nano es significativamente distinto, en su perfil de capacidades, del que impulsaba el slug en el lanzamiento.
Los dos efectos se combinan. Los equipos que no han monitorizado activamente este slug pueden estar corriendo sobre pesos que han derivado múltiples veces a lo largo de la vida útil del slug flotante, contra una integración original calibrada al comportamiento de lanzamiento, con tuberías downstream que han ido absorbiendo silenciosamente cambios de formato y calidad mediante parches acumulados.
La cura no es complicada: fijar una instantánea con fecha en producción, monitorizar la deriva con una suite canario, planificar las migraciones explícitamente en lugar de absorberlas a través de la rotación del slug flotante. La cura raramente se aplica en el nivel nano porque las cargas de trabajo parecen de bajo impacto individualmente y el volumen oculta el coste acumulado.
Qué sigue haciendo este slug
Para clasificación rutinaria sobre un conjunto pequeño de categorías, extracción simple de campos con estructura predecible y completado de forma corta, el modelo sigue haciendo un trabajo útil. El coste por llamada es bajo. El perfil de latencia es el más bajo de la familia.
Para tuberías de prefiltrado que escalan a niveles mayores en función de la salida de clasificación, el modelo encaja con naturalidad como primera etapa incluso hoy. El patrón de escalado absorbe gran parte de la brecha de calidad porque los niveles superiores se ocupan de los casos difíciles.
Bajo el capó
GPT-5 Nano es un decodificador transformer con una escala de parámetros sustancialmente menor que mini, multimodal entre texto y visión, pero con una capacidad de visión notablemente más débil que los niveles superiores. OpenAI no ha publicado el recuento de parámetros.
La tokenización usa el vocabulario BPE estándar de GPT-5. Las entradas de imagen se codifican por mosaicos a un coste fijo de tokens por mosaico. La ventana de contexto es más corta que la de los niveles superiores en términos absolutos, y la coherencia decae mucho antes del límite nominal.
El modelo es significativamente más barato por token que mini, más rápido por solicitud, y la brecha respecto a mini es mayor que la brecha de mini a la base. El corte de entrenamiento se sitúa a mediados de 2025 para los pesos de lanzamiento; si el slug flotante apunta actualmente a una instantánea refrescada, el corte efectivo puede diferir.
Dónde se posiciona hoy
Frente a las ofertas actuales del nivel más pequeño, el modelo — sea cual sea la instantánea a la que resuelva actualmente el slug flotante — se sitúa por debajo de los nanos más nuevos de GPT-5 en la mayoría de las dimensiones de benchmark. El leaderboard de inteligencia sigue la posición comparativa.
Para extracción de datos en su extremo simple y flujos de contenido en el extremo de forma corta, el modelo sigue produciendo salidas utilizables. Para cualquier cosa más exigente, los nanos más nuevos son claramente mejores.
Dónde están los límites
El razonamiento es superficial. Cualquier cosa que requiera inferencia más allá del emparejamiento de patrones es incorrecta para nano.
La coherencia en contexto largo es pobre. Mantén los prompts compactos.
La salida estructurada funciona en esquemas simples y se rompe en los complejos.
La alucinación en temas nicho es mayor que en los niveles superiores. La menor capacidad se manifiesta aquí.
La calidad de visión cae notablemente respecto a los niveles superiores. La lectura estándar de gráficos y el OCR funcionan; los diagramas complejos y los layouts adversariales a menudo no.
El rendimiento en lenguas distintas del inglés es más débil, especialmente en lenguas de bajos recursos.
El conocimiento de desarrollos recientes se detiene en el punto en el que la instantánea actual del slug flotante haya cortado — que puede o no coincidir con aquello contra lo que evaluaste.
Cuándo este slug es la elección correcta
Los casos estrechos:
Estás ejecutando tuberías de prefiltrado en las que la calidad de clasificación es suficiente para la primera etapa y los escalados se encargan de los casos difíciles.
Estás haciendo autocompletado por pulsación de tecla donde la latencia es la restricción principal y el listón de calidad es "mejor que ninguna sugerencia".
Estás ejecutando herramientas internas donde la deriva de comportamiento es genuinamente tolerable.
Cuándo migrar a un pin con fecha o a una generación más nueva
Estás moviendo tráfico de producción con requisitos de estabilidad y no has fijado el modelo. Fija la instantánea de nano con fecha de esta generación, o migra al nano con fecha de una generación más nueva.
Tus tuberías downstream dependen de formatos de salida específicos y has estado absorbiendo la deriva de formato mediante parches silenciosos.
Tu harness de evaluación necesita producir resultados comparables a lo largo del tiempo, algo que el slug flotante hace imposible.
Estás en un contexto regulado donde las pistas de auditoría necesitan identificar el modelo que produjo cualquier salida concreta.
Has medido el coste acumulado de la deriva o de la brecha de capacidad en tu carga de trabajo y supera al coste de migración.
Los dos caminos
Camino uno: fijar la instantánea con fecha de esta generación (gpt-5-nano-2025-08-07). Esto estabiliza el comportamiento sin cambiar la capacidad. Razonable para cargas de trabajo donde la calidad actual es adecuada.
Camino dos: migrar al nano con fecha de una generación más nueva (5.2 Nano, 5.4 Nano, 5.5 Nano). Esto trae mejoras de capacidad junto con la disciplina de fijado. Razonable para cargas de trabajo donde la calidad actual se ha vuelto marginal.
Cualquiera de los dos caminos implica ejecutar evaluación previa al despliegue contra el objetivo, validar las tuberías downstream y cortar el tráfico de producción. No hacer nada significa seguir absorbiendo la deriva del slug flotante en un nivel donde el efecto acumulado es grande.
Alternativas
Para cargas de trabajo que necesitan comportamiento fijado en el nivel más pequeño en otro proveedor, las instantáneas equivalentes a nano comparables de Anthropic y Google se distribuyen con el mismo patrón de fijado.
Para máxima optimización de coste, clasificadores pequeños open-weights ejecutados en tu propia infraestructura pueden igualar al nano de esta generación en tareas estrechas a un coste marginal casi nulo más allá del gasto en GPU.
Última revisión técnica: 2026-05-22 — Tokonomix.ai
