Ir al contenido
Se ejecuta en:USCreado en:United States
OpenAI

gpt-5-nano-2025-08-07

Equipo editorial Tokonomix·Revisado por Mes Kalkan··

GPT-5-nano-2025-08-07 es un modelo de generación de texto desarrollado por OpenAI, lanzado en agosto de 2025. Como indica su designación "nano", este modelo representa una variante compacta en la familia GPT-5, priorizando la eficiencia y requisitos computacionales reducidos mientras mantiene capacidades fundamentales de comprensión del lenguaje. Realiza tareas estándar de generación de texto incluyendo respuestas a preguntas, resúmenes, creación de contenido e interacciones conversacionales. Las especificaciones técnicas del modelo incluyen capacidades estándar de generación de texto, aunque el tamaño de su ventana de contexto no ha sido divulgado públicamente. La clasificación "nano" sugiere optimizaciones arquitectónicas para despliegue en entornos con recursos limitados o aplicaciones donde se prioriza menor latencia sobre capacidad máxima. Este posicionamiento lo hace adecuado para integración en aplicaciones que requieren tiempos de respuesta rápidos u operan con recursos computacionales limitados. Dentro de la línea de modelos de OpenAI, GPT-5-nano se sitúa en el extremo más pequeño de la serie GPT-5, complementando variantes más grandes que ofrecen capacidades expandidas y ventanas de contexto mayores. El modelo sirve casos de uso donde no se requiere rendimiento de modelo a escala completa, como interacciones simples de chatbot, clasificación básica de texto o aplicaciones que procesan entradas más cortas. La fecha de lanzamiento en agosto de 2025 indica que incorpora datos de entrenamiento y mejoras arquitectónicas disponibles en ese momento, aunque detalles técnicos específicos sobre cantidad de parámetros y metodología de entrenamiento no han sido hechos públicos.

GPT-5 Nano es el modelo más compacto de la familia GPT-5, diseñado para máxima eficiencia y velocidad en tareas de baja a media complejidad.

Resumen de benchmark Tokonomix
Sección 01

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰
Tarifas API — gpt-5-nano-2025-08-07
$0.0500 por 1M de tokens de entrada
$0.4000 por 1M de tokens de salida
≈ $0.0001 por conversación típica (800 tokens)
Precio entrada vs salida (por 1M de tokens)
por 1M de tokens de entrada$0.0500
por 1M de tokens de salida$0.4000

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.0500

input / 1M

— stable

$0.4000

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Sección 02

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Máxima velocidad en la familia GPT-5Mínimo consumo de recursosEscala para altísimo volumen de consultasLatencia óptima para aplicaciones reactivasTareas de texto básicas bien cubiertasArquitectura GPT-5 a menor costo

Debilidades

Capacidad de razonamiento muy limitadaContexto no documentadoSolo para tareas simplesAnálisis complejo fuera de su alcance
Sección 03

Capacidades

toolssource: litellmvisionjson modepdf inputreasoningjson schemaparallel toolsprompt cachingmax output tokens: 128000
Sección 04

Preguntas frecuentes

Nano es aún más pequeño y rápido; mini ofrece mejor equilibrio capacidad-velocidad para la mayoría de casos.

Trae la arquitectura GPT-5 a entornos con recursos limitados, donde la velocidad y el costo son más críticos que la máxima capacidad.

Resumen de benchmark Tokonomix
Sección 05

Disponibilidad

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 06

Veredictos del benchmark Tokonomix

2026-06-14

New capabilities added: tools, vision, reasoning, and PDF processing

GPT-5-nano-2025-08-07 introduces a substantial expansion of capabilities compared to the previous benchmark window. The model now supports function calling through both single and parallel tools execution, visual input processing, structured output via JSON mode and JSON schema, PDF document input, reasoning capabilities, and prompt caching for improved efficiency. These additions transform the model from a text-only interface into a multimodal system capable of handling diverse input types and output formats. The reasoning feature suggests enhanced chain-of-thought capabilities, while parallel tools execution enables more complex workflows. PDF input support addresses a common enterprise need for document processing. JSON schema validation provides developers with stronger guarantees around structured outputs compared to basic JSON mode. Prompt caching should reduce latency and costs for applications with repeated context. However, no benchmark performance data is available for either the current or previous window, making it impossible to assess quantitative improvements in accuracy, speed, or quality metrics. Users gain significant functional flexibility with these new capabilities, but should conduct their own testing to verify performance meets their requirements across different use cases and modalities.

Quality

Latency p50

Test runs

0

Multimodal vision support added Function calling now available Reasoning capabilities introduced PDF input processing enabled
Sección 07

Perfil completo del modelo

gpt-5-nano-2025-08-07 — illustration 1
GPT-5 Nano (instantánea 2025-08-07): la migración más sencilla de la familia

Esta es la instantánea fechada del GPT-5 Nano original, congelada en el lanzamiento del 7 de agosto de 2025. Es el nano fechado más antiguo de la familia y el candidato más claro para una migración proactiva — no porque el modelo esté roto, sino porque el coste de migración en el nivel nano es inusualmente bajo y las ganancias de pasar a un nano más reciente son inusualmente altas.

Por qué las migraciones nano son más fáciles de lo que parecen

Los proyectos de migración entre niveles de modelo suelen implicar trabajo significativo de ingeniería de prompts, actualizaciones de pipelines posteriores y ciclos de validación. El coste puede dominar la decisión de migrar incluso cuando el nuevo modelo es claramente mejor.

El nivel nano invierte esto. Las cargas de trabajo nano tienden a ser simples por construcción — clasificación sobre un conjunto pequeño de etiquetas, extracción de campos bien definidos, salida estructurada corta. Los prompts suelen ser breves. Los consumidores posteriores normalmente quieren salidas simples. La superficie de validación es estrecha.

Esto significa que migrar de una generación nano a otra típicamente requiere una fracción del esfuerzo de ingeniería que la misma migración cuesta en los niveles base o Pro. Los prompts se portan con ajustes menores. La evaluación es rápida porque el espacio de salida es pequeño. Los cambios posteriores suelen limitarse a manejar ligeros cambios de formato.

La combinación de bajo coste de migración y ganancias sustanciales de capacidad hace que el cálculo de migración sea fácil. Para equipos que permanecen en esta instantánea, la pregunta normalmente no es "¿vale la pena la migración?" sino "¿por qué no la hemos hecho ya?".

Qué captura esta instantánea

El lanzamiento de agosto de 2025 de GPT-5 Nano: pesos de lanzamiento, comportamiento de lanzamiento en clasificación y extracción, perfil de latencia de lanzamiento, configuración del codificador de visión de lanzamiento para esta clase de tamaño. El modelo no ha cambiado desde entonces.

Las mejoras que la línea GPT-5 más amplia ha acumulado en generaciones subsiguientes — mejor precisión de clasificación, manejo más estricto de salidas estructuradas, mejor calidad de completado por pulsación de tecla, conocimiento de desarrollos posteriores a mediados de 2025 — ninguna de estas aparece aquí.

Bajo el capó

Arquitectónicamente este es el decodificador transformer GPT-5 Nano a una escala de parámetros sustancialmente menor que mini. El modelo acepta entradas intercaladas de texto e imagen y emite salida solo de texto. OpenAI no ha publicado recuentos de parámetros.

La tokenización utiliza el vocabulario BPE estándar de GPT-5. Las entradas de imagen se codifican en mosaicos con un coste fijo de tokens por mosaico. La ventana de contexto es más corta que los niveles más grandes en términos absolutos. El corte de entrenamiento aterriza a mediados de 2025.

Dónde se sitúa hoy

Frente a las ofertas actuales de nivel más pequeño, la instantánea de agosto de 2025 se sitúa muy por debajo de los nanos GPT-5 más recientes en la mayoría de las dimensiones de benchmark. La clasificación de inteligencia rastrea la posición comparativa; la brecha se ha ido ampliando a medida que aterrizan generaciones más recientes.

Para pipelines de prefiltrado que escalan casos difíciles, la instantánea todavía funciona como primera etapa. Para cargas de trabajo donde la salida nano es la respuesta final, la brecha de calidad respecto a nanos más recientes empieza a importar.

Cuándo mantener este anclaje en su lugar

Los casos para permanecer en esta instantánea son limitados:

Tienes pipelines posteriores estrechamente calibrados a los patrones de salida específicos de este modelo y incluso el pequeño coste de migración está actualmente injustificado por alguna razón.

Estás en un contexto regulado donde este anclaje específico es parte de un ciclo de auditoría activo.

Tu carga de trabajo es tan rutinaria que la brecha de calidad respecto a nanos más recientes tiene cero efecto medible en los resultados.

Cuándo migrar ahora

Para la mayoría de equipos que permanecen en esta instantánea, la respuesta es "ahora". Los detonantes claros:

OpenAI ha publicado la cronología de deprecación. Las instantáneas nano más antiguas tienden a finalizar relativamente temprano en el ciclo de deprecación porque el coste de migración es bajo y la base de usuarios activos es menor.

Tu harness de evaluación muestra que nanos más recientes manejan tu carga de trabajo con significativamente menos fallos. La brecha de precisión de clasificación, la brecha de calidad de extracción, la brecha de capacidad de visión — cualquiera de estas puede justificar la migración por sí sola.

Necesitas conocimiento posterior a mediados de 2025. Este modelo no tiene ninguno.

Tu equipo de ingeniería tiene ancho de banda para un proyecto de migración de bajo esfuerzo y alto apalancamiento. Las migraciones nano son exactamente eso.

El patrón de migración

Elige el nano objetivo. El nano fechado estable más reciente en la familia GPT-5 suele ser la respuesta correcta — 5.4 Nano fechado, 5.5 Nano fechado, o el que sea actual cuando migres. Ancla la versión fechada del objetivo.

Porta los prompts. Ejecuta el conjunto de prompts existente contra el nano objetivo. Compara las salidas contra la instantánea actual en una muestra representativa de tu tráfico. Identifica el pequeño número de casos donde el nuevo modelo se comporta de manera diferente y ajusta los prompts según sea necesario.

Valida lo posterior. Verifica que los pipelines posteriores manejen los ligeros cambios de formato que pueden venir con la nueva generación. La mayoría de los pipelines los absorben sin cambios; algunos pueden necesitar pequeños ajustes a la lógica de análisis.

Realiza el cambio. Actualiza el tráfico de producción al nuevo anclaje. Monitoriza durante los primeros días cualquier cosa que la evaluación haya pasado por alto.

Retira el anclaje antiguo. Elimina referencias en código, configuración e infraestructura al slug antiguo. El proyecto completo suele tomar unos pocos días para una carga de trabajo de complejidad moderada.

Dónde siguen estando los límites

Se aplican los límites nano estándar: razonamiento superficial, pobre coherencia de contexto largo, rendimiento débil en esquemas complejos, mayor alucinación que niveles más grandes, rendimiento más débil en idiomas no ingleses. Ninguno de estos cambia con el anclaje.

El límite de conocimiento de corte temprano es específico de esta instantánea. Los desarrollos posteriores a mediados de 2025 son invisibles para este modelo y cualquier nano más reciente sabrá más sobre ellos.

Alternativas

Para cargas de trabajo que necesitan comportamiento de nivel más pequeño anclado en un proveedor diferente, las instantáneas equivalentes nano comparables de Anthropic y Google ofrecen el mismo patrón de anclaje.

Para cargas de trabajo optimizadas en coste donde el ecosistema OpenAI no es crítico, los clasificadores pequeños de pesos abiertos ejecutándose en tu propia infraestructura proporcionan la historia de residencia y la previsibilidad operacional que los slugs flotantes no pueden.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

gpt-5-nano-2025-08-07 — illustration 2gpt-5-nano-2025-08-07 — illustration 3
Última prueba automática
14 jun 2026 · 04:54 UTC · Benchmark
Latencia P50
Latencia P95
Errores
1 / 6 ejecuciones
Última revisión por Equipo Tokonomix·26 de mayo de 2026