Tier B — Producción

Se ejecuta en:USCreado en:United States

$0.4000

salida · por 1M de tokens (coste base)

Coste

2,962 ms

Velocidad de respuesta

100 / 100

Inteligencia

Veredicto — resumenLIVE

● LIVE

ahora · 2026-07-26

Quality jumps 23 points with multilingual gains; reasoning remains absent

✓ Quality up 23 points✓ Multilingual now fully functional✗ Reasoning capability at zero✓ Latency improved 6%

The gpt-5-nano model shows substantial improvement in its second benchmark window, climbing from 31.7 to 55.0 in overall quality score. The most dramatic change is in multilingual capability, which surged from 0 to a perfect 100, indicating the model now handles non-English tasks competently. Factual performance emerged at a solid 75, representing a new strength area. Creative output held steady at 45 across both windows, showing consistency in this dimension. However, reasoning capability registered at 0, marking a critical weakness that users should consider for logic-intensive applications. Latency improved modestly, with p50 dropping from 5189ms to 4895ms, though response times remain in the multi-second range. The coding category, previously tested at 50, was not evaluated in the current window. With five test runs compared to the previous four, the current results carry slightly more statistical weight. Users seeking multilingual or factual tasks may find value here, but those requiring reasoning capabilities should look elsewhere until this gap is addressed.

Quality

55.0

Latency p50

4,895 ms

Test runs

1 de 11

Imagen y explicaciónLIVE

OpenAI

gpt-5-nano-2025-08-07

Tier B — Producción

Equipo editorial Tokonomix·Revisado por Mes Kalkan·Publicado 22 de mayo de 2026·Última revisión 26 de mayo de 2026

GPT-5-nano-2025-08-07 es un modelo de generación de texto desarrollado por OpenAI, lanzado en agosto de 2025. Como indica su designación "nano", este modelo representa una variante compacta en la familia GPT-5, priorizando la eficiencia y requisitos computacionales reducidos mientras mantiene capacidades fundamentales de comprensión del lenguaje. Realiza tareas estándar de generación de texto incluyendo respuestas a preguntas, resúmenes, creación de contenido e interacciones conversacionales. Las especificaciones técnicas del modelo incluyen capacidades estándar de generación de texto, aunque el tamaño de su ventana de contexto no ha sido divulgado públicamente. La clasificación "nano" sugiere optimizaciones arquitectónicas para despliegue en entornos con recursos limitados o aplicaciones donde se prioriza menor latencia sobre capacidad máxima. Este posicionamiento lo hace adecuado para integración en aplicaciones que requieren tiempos de respuesta rápidos u operan con recursos computacionales limitados. Dentro de la línea de modelos de OpenAI, GPT-5-nano se sitúa en el extremo más pequeño de la serie GPT-5, complementando variantes más grandes que ofrecen capacidades expandidas y ventanas de contexto mayores. El modelo sirve casos de uso donde no se requiere rendimiento de modelo a escala completa, como interacciones simples de chatbot, clasificación básica de texto o aplicaciones que procesan entradas más cortas. La fecha de lanzamiento en agosto de 2025 indica que incorpora datos de entrenamiento y mejoras arquitectónicas disponibles en ese momento, aunque detalles técnicos específicos sobre cantidad de parámetros y metodología de entrenamiento no han sido hechos públicos.

GPT-5 Nano es el modelo más compacto de la familia GPT-5, diseñado para máxima eficiencia y velocidad en tareas de baja a media complejidad.
— Resumen de benchmark Tokonomix

Capacidades

toolssource: litellmvisionjson modepdf inputreasoningjson schemaparallel toolsprompt cachingmax output tokens: 128000

GPT-5 Nano (instantánea 2025-08-07): la migración más sencilla de la familia

Esta es la instantánea fechada del GPT-5 Nano original, congelada en el lanzamiento del 7 de agosto de 2025. Es el nano fechado más antiguo de la familia y el candidato más claro para una migración proactiva — no porque el modelo esté roto, sino porque el coste de migración en el nivel nano es inusualmente bajo y las ganancias de pasar a un nano más reciente son inusualmente altas.

Por qué las migraciones nano son más fáciles de lo que parecen

Los proyectos de migración entre niveles de modelo suelen implicar trabajo significativo de ingeniería de prompts, actualizaciones de pipelines posteriores y ciclos de validación. El coste puede dominar la decisión de migrar incluso cuando el nuevo modelo es claramente mejor.

El nivel nano invierte esto. Las cargas de trabajo nano tienden a ser simples por construcción — clasificación sobre un conjunto pequeño de etiquetas, extracción de campos bien definidos, salida estructurada corta. Los prompts suelen ser breves. Los consumidores posteriores normalmente quieren salidas simples. La superficie de validación es estrecha.

Esto significa que migrar de una generación nano a otra típicamente requiere una fracción del esfuerzo de ingeniería que la misma migración cuesta en los niveles base o Pro. Los prompts se portan con ajustes menores. La evaluación es rápida porque el espacio de salida es pequeño. Los cambios posteriores suelen limitarse a manejar ligeros cambios de formato.

La combinación de bajo coste de migración y ganancias sustanciales de capacidad hace que el cálculo de migración sea fácil. Para equipos que permanecen en esta instantánea, la pregunta normalmente no es "¿vale la pena la migración?" sino "¿por qué no la hemos hecho ya?".

Qué captura esta instantánea

El lanzamiento de agosto de 2025 de GPT-5 Nano: pesos de lanzamiento, comportamiento de lanzamiento en clasificación y extracción, perfil de latencia de lanzamiento, configuración del codificador de visión de lanzamiento para esta clase de tamaño. El modelo no ha cambiado desde entonces.

Las mejoras que la línea GPT-5 más amplia ha acumulado en generaciones subsiguientes — mejor precisión de clasificación, manejo más estricto de salidas estructuradas, mejor calidad de completado por pulsación de tecla, conocimiento de desarrollos posteriores a mediados de 2025 — ninguna de estas aparece aquí.

Bajo el capó

Arquitectónicamente este es el decodificador transformer GPT-5 Nano a una escala de parámetros sustancialmente menor que mini. El modelo acepta entradas intercaladas de texto e imagen y emite salida solo de texto. OpenAI no ha publicado recuentos de parámetros.

La tokenización utiliza el vocabulario BPE estándar de GPT-5. Las entradas de imagen se codifican en mosaicos con un coste fijo de tokens por mosaico. La ventana de contexto es más corta que los niveles más grandes en términos absolutos. El corte de entrenamiento aterriza a mediados de 2025.

Dónde se sitúa hoy

Frente a las ofertas actuales de nivel más pequeño, la instantánea de agosto de 2025 se sitúa muy por debajo de los nanos GPT-5 más recientes en la mayoría de las dimensiones de benchmark. La clasificación de inteligencia rastrea la posición comparativa; la brecha se ha ido ampliando a medida que aterrizan generaciones más recientes.

Para pipelines de prefiltrado que escalan casos difíciles, la instantánea todavía funciona como primera etapa. Para cargas de trabajo donde la salida nano es la respuesta final, la brecha de calidad respecto a nanos más recientes empieza a importar.

Cuándo mantener este anclaje en su lugar

Los casos para permanecer en esta instantánea son limitados:

Tienes pipelines posteriores estrechamente calibrados a los patrones de salida específicos de este modelo y incluso el pequeño coste de migración está actualmente injustificado por alguna razón.

Estás en un contexto regulado donde este anclaje específico es parte de un ciclo de auditoría activo.

Tu carga de trabajo es tan rutinaria que la brecha de calidad respecto a nanos más recientes tiene cero efecto medible en los resultados.

Cuándo migrar ahora

Para la mayoría de equipos que permanecen en esta instantánea, la respuesta es "ahora". Los detonantes claros:

OpenAI ha publicado la cronología de deprecación. Las instantáneas nano más antiguas tienden a finalizar relativamente temprano en el ciclo de deprecación porque el coste de migración es bajo y la base de usuarios activos es menor.

Tu harness de evaluación muestra que nanos más recientes manejan tu carga de trabajo con significativamente menos fallos. La brecha de precisión de clasificación, la brecha de calidad de extracción, la brecha de capacidad de visión — cualquiera de estas puede justificar la migración por sí sola.

Necesitas conocimiento posterior a mediados de 2025. Este modelo no tiene ninguno.

Tu equipo de ingeniería tiene ancho de banda para un proyecto de migración de bajo esfuerzo y alto apalancamiento. Las migraciones nano son exactamente eso.

El patrón de migración

Elige el nano objetivo. El nano fechado estable más reciente en la familia GPT-5 suele ser la respuesta correcta — 5.4 Nano fechado, 5.5 Nano fechado, o el que sea actual cuando migres. Ancla la versión fechada del objetivo.

Porta los prompts. Ejecuta el conjunto de prompts existente contra el nano objetivo. Compara las salidas contra la instantánea actual en una muestra representativa de tu tráfico. Identifica el pequeño número de casos donde el nuevo modelo se comporta de manera diferente y ajusta los prompts según sea necesario.

Valida lo posterior. Verifica que los pipelines posteriores manejen los ligeros cambios de formato que pueden venir con la nueva generación. La mayoría de los pipelines los absorben sin cambios; algunos pueden necesitar pequeños ajustes a la lógica de análisis.

Realiza el cambio. Actualiza el tráfico de producción al nuevo anclaje. Monitoriza durante los primeros días cualquier cosa que la evaluación haya pasado por alto.

Retira el anclaje antiguo. Elimina referencias en código, configuración e infraestructura al slug antiguo. El proyecto completo suele tomar unos pocos días para una carga de trabajo de complejidad moderada.

Dónde siguen estando los límites

Se aplican los límites nano estándar: razonamiento superficial, pobre coherencia de contexto largo, rendimiento débil en esquemas complejos, mayor alucinación que niveles más grandes, rendimiento más débil en idiomas no ingleses. Ninguno de estos cambia con el anclaje.

El límite de conocimiento de corte temprano es específico de esta instantánea. Los desarrollos posteriores a mediados de 2025 son invisibles para este modelo y cualquier nano más reciente sabrá más sobre ellos.

Alternativas

Para cargas de trabajo que necesitan comportamiento de nivel más pequeño anclado en un proveedor diferente, las instantáneas equivalentes nano comparables de Anthropic y Google ofrecen el mismo patrón de anclaje.

Para cargas de trabajo optimizadas en coste donde el ecosistema OpenAI no es crítico, los clasificadores pequeños de pesos abiertos ejecutándose en tu propia infraestructura proporcionan la historia de residencia y la previsibilidad operacional que los slugs flotantes no pueden.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

Comparación de proveedoresLIVE

Comparación de proveedores

Compara cada proveedor de este modelo — coste base, calidad, latencia y disponibilidad.

Azure OpenAI (EU - Sweden)UE

Coste de entrada✓ mejor$0.0500

Coste de salida$0.4000

CalidadAún sin probar

Latencia (p50)Aún sin probar

DisponibilidadAún sin probar

Costes por 1M de tokens (coste base)

OpenAIEE. UU.Esta oferta

Coste de entrada$0.0500

Coste de salida$0.4000

Calidad✓ mejor100.0

Latencia (p50)✓ mejor2,962 ms

DisponibilidadAún sin probar

Costes por 1M de tokens (coste base)

Inteligencia de consenso

TODO EL MODELOINACTIVO

Las señales de consenso son de todo el modelo — todavía no por proveedor.

El scoring de consenso aún recopila datos para este modelo — todavía sin señales.

Votos de la comunidadLIVE

Votos de la comunidad

Lo que opinan los visitantes reales — por proveedor.

Azure OpenAI (EU - Sweden)UE

Aún no hay votos de la comunidad.

OpenAIEE. UU.

Aún no hay votos de la comunidad.

Más resultados — por proveedor

Calidad por categoría

Rúbrica de juego

Aún sin datos.

Veredicto del juez

■ OK 25%■ Parcial 5%■ Incorrecto 70%

Juegos y arena

Aún sin datos.

Velocidad y salud

2,962 ms

Latencia (p50)

—

Disponibilidad

Calidad por categoría

Rúbrica de juego

Aún sin datos.

Veredicto del juez

■ OK 25%■ Parcial 5%■ Incorrecto 70%

Juegos y arena

Aún sin datos.

Velocidad y salud

2,962 ms

Latencia (p50)

—

Disponibilidad

Pregunta y respuesta — explorarLIVE

1 de 80

🧠 inteligenciaOpenAImultilingual · 2026-07-26puntuación: 100

Bir mağazada %20 indirim uygulanıyor. 150 TL olan bir ürün indirimden sonra kaç TL olur?

120 TL. İndirim tutarı: 150 × 0.20 = 30 TL → Son fiyat: 150 − 30 = 120 TL (alternatif: 150 × 0.80 = 120).

Historial de pruebas — todos los proveedoresLIVE

Puntuación de calidad en el tiempoúltimo 53

Velocidad — latencia p50 en el tiempo

Aparece una tendencia cuando este modelo se ha probado en varios días distintos.

📝Veredicto — resumenLIVE

Quality jumps 23 points with multilingual gains; reasoning remains absent

🖼️Imagen y explicaciónLIVE

gpt-5-nano-2025-08-07

Capacidades

Por qué las migraciones nano son más fáciles de lo que parecen

Qué captura esta instantánea

Bajo el capó

Dónde se sitúa hoy

Cuándo mantener este anclaje en su lugar

Cuándo migrar ahora

El patrón de migración

Dónde siguen estando los límites

Alternativas

📊Comparación de proveedoresLIVE

🧠Inteligencia de consenso

👥Votos de la comunidadLIVE

🔬Más resultados — por proveedor

💬Pregunta y respuesta — explorarLIVE

🗂️Historial de pruebas — todos los proveedoresLIVE

Veredicto — resumenLIVE

Imagen y explicaciónLIVE

Comparación de proveedoresLIVE

Inteligencia de consenso

Votos de la comunidadLIVE

Más resultados — por proveedor

Pregunta y respuesta — explorarLIVE

Historial de pruebas — todos los proveedoresLIVE