Tier C — Especialista

Se ejecuta en:USCreado en:United States

$2.00

salida · por 1M de tokens (coste base)

Coste

695 ms

Velocidad de respuesta

Aún sin probar

Inteligencia

Veredicto — resumenLIVE

● LIVE

ahora · 2026-07-26

Quality drops 31 points while latency improves; reasoning capability lost

✗ Quality dropped 31 points✗ Reasoning capability at zero✓ Latency improved 32%✓ Creative score up to 73

GPT-5-mini experienced a significant quality decline in this benchmark window, falling from 80.7 to 49.4 overall. The most concerning change is the complete loss of reasoning capability, which now scores zero compared to absent measurement in the previous window. Factual performance has also deteriorated substantially to 25 points, representing a critical weakness. The coding category, which previously scored a perfect 100, was not evaluated in the current window. On the positive side, creative performance improved from 45 to 73 points, and multilingual capability remained exceptionally strong, maintaining near-perfect scores at 100 compared to 97 previously. Latency showed meaningful improvement with p50 dropping from 8096ms to 5487ms, a 32% reduction that delivers noticeably faster responses. However, this speed gain comes at a considerable cost to output quality. The model appears to have undergone changes that prioritized response time over accuracy and logical reasoning. Users requiring factual accuracy or complex reasoning should exercise caution with this version, while those focused on creative multilingual tasks may still find value despite the reduced latency benefiting all use cases.

Quality

49.4

Latency p50

5,487 ms

Test runs

1 de 11

Imagen y explicaciónLIVE

OpenAI

gpt-5-mini

Tier C — Especialista

Equipo editorial Tokonomix·Revisado por Mes Kalkan·Publicado 22 de mayo de 2026·Última revisión 26 de mayo de 2026

GPT-5-mini es un modelo de lenguaje desarrollado por OpenAI como parte de su serie GPT (Generative Pre-trained Transformer). Este modelo representa una variante compacta en la arquitectura de quinta generación de OpenAI, diseñada para proporcionar capacidades estándar de generación de texto para una variedad de tareas de procesamiento de lenguaje natural que incluyen conversación, creación de contenido, resumen y respuesta a preguntas. El modelo procesa entrada de texto y genera respuestas coherentes basadas en patrones aprendidos durante su entrenamiento con diversos datos de texto de internet. Como variante "mini", GPT-5-mini se posiciona como una opción más eficiente en recursos en comparación con modelos más grandes de la misma generación. Ofrece un equilibrio entre rendimiento y requisitos computacionales, haciéndolo adecuado para aplicaciones donde las capacidades de un modelo a escala completa pueden no ser necesarias. El modelo admite tareas estándar de generación de texto con precisión y fluidez razonables, aunque puede mostrar limitaciones en comparación con variantes más grandes al manejar razonamiento altamente complejo o conocimiento especializado de dominio. La especificación de la ventana de contexto permanece sin confirmar en la documentación pública. Dentro de la línea de modelos de OpenAI, GPT-5-mini sirve como un punto de entrada accesible a las capacidades de quinta generación, situándose por debajo de las variantes estándar y más grandes en términos de cantidad de parámetros y carga computacional. Sigue el patrón establecido de OpenAI de ofrecer múltiples tamaños de modelo dentro de cada generación para acomodar diferentes casos de uso y restricciones de recursos, similar a las variantes mini anteriores en las series GPT-3.5 y GPT-4.

GPT-5-mini representa la apuesta de OpenAI por democratizar el acceso a capacidades de quinta generación sin comprometer gravemente el rendimiento en tareas cotidianas de procesamiento de lenguaje.
— Resumen editorial de Tokonomix

Capacidades

toolssource: litellmvisionjson modepdf inputreasoningjson schemaparallel toolsprompt cachingmax output tokens: 128000

GPT-5 Mini: el tier mini original, aún presente en muchos stacks de producción

GPT-5 Mini es el modelo de tier pequeño del lanzamiento original de GPT-5 en agosto de 2025. Ha sido el modelo mini predeterminado de OpenAI para muchos equipos desde entonces, manejando el extremo económico y rápido de innumerables cargas de trabajo. La pregunta interesante para esos equipos es si el modelo todavía está ganándose su lugar o si se ha convertido silenciosamente en un impuesto — ejecutándose porque siempre lo ha hecho, a pesar de que los tiers mini más nuevos son significativamente mejores.

La trampa del "el mini viejo aún funciona bien"

Lo que ocurre con los modelos de tier pequeño es que son confiables. Las cargas de trabajo que manejan — clasificación, extracción simple, completado de forma corta, automatización de servicio al cliente — toleran un amplio rango de calidad. Si el mini que desplegaste hace dos años todavía está produciendo salidas aceptables, el instinto natural es dejarlo como está.

Lo que este instinto pasa por alto es el costo de oportunidad. Las mejoras en el tier mini entre generaciones de GPT-5 han sido sustanciales, más grandes en términos proporcionales que las ganancias en los tiers base o Pro. Una carga de trabajo que se ejecuta en el GPT-5 Mini original hoy probablemente funcionaría notablemente mejor en 5.4 Mini y dramáticamente más barata por salida útil si las diferencias de calidad significan menos fallos posteriores.

La trampa está en confundir "todavía funciona" con "todavía es la elección correcta". Para cargas de trabajo de alto volumen donde el modelo maneja miles de solicitudes por día, tanto la brecha de calidad acumulada como la brecha de costo acumulado suman. La migración raramente es urgente. A menudo está atrasada.

Lo que este modelo todavía hace

GPT-5 Mini sigue siendo competente en las cargas de trabajo para las que fue construido. Clasificación a través de un conjunto pequeño de categorías. Extracción simple de campos bien definidos. Salida estructurada de forma corta. Autocompletado por pulsación de tecla con calidad aceptable pero no impresionante.

Para herramientas internas donde el usuario es tolerante, procesos por lotes donde el costo de una salida incorrecional ocasional es pequeño, e integraciones heredadas cuya migración se ha diferido, el modelo continúa haciendo trabajo útil.

Bajo el capó

GPT-5 Mini es un decodificador transformer a una escala de parámetros más pequeña que el base 5.0. El modelo acepta entradas intercaladas de texto e imagen y emite salida solo de texto. OpenAI no ha publicado el recuento de parámetros.

La tokenización utiliza el vocabulario BPE estándar de GPT-5. Las entradas de imagen se codifican en mosaico con un costo de token fijo por mosaico. El corte de entrenamiento se sitúa a mediados de 2025. El modelo conoce los estándares de lenguaje principales y las versiones de frameworks vigentes hasta ese período.

Dónde se sitúa hoy

Frente a las ofertas actuales de tier pequeño, GPT-5 Mini se sitúa por debajo de los minis de GPT-5 más nuevos en la mayoría de las dimensiones de benchmark. La tabla de clasificación de inteligencia rastrea la posición comparativa. La brecha con 5.4 Mini específicamente es lo suficientemente grande como para merecer medición en tu propia carga de trabajo.

Para flujos de trabajo de contenido en el extremo rutinario, el modelo todavía produce salida utilizable. Para extracción de datos en documentos estándar, maneja el trabajo, aunque los minis más nuevos lo hacen de manera más confiable.

Dónde se muestran los límites

La alucinación sobre temas de nicho es más común que en los tiers mini más nuevos. La capacidad más pequeña del modelo en relación con el base se muestra aquí.

El conocimiento de desarrollos recientes se detiene a mediados de 2025. Las características de lenguaje posteriores al corte, los lanzamientos de bibliotecas y los eventos actuales están fuera de sus datos de entrenamiento.

La calidad de visión es más débil que la de los minis más nuevos en diseños complejos y entradas adversarias.

La coherencia de contexto largo es pobre para cualquier contexto más allá de prompts cortos. Las restricciones establecidas temprano derivan rápidamente.

El rendimiento en idiomas que no son inglés, especialmente en lenguas de recursos más bajos, es más débil que lo que proporcionan las generaciones más nuevas.

Cuándo migrar

Los disparadores claros:

Estás ejecutando mini a través de tráfico de alto volumen y el costo acumulado de pequeños problemas de calidad — correcciones manuales, quejas de clientes sobre patrones de salida específicos, fallos de análisis posteriores — se ha vuelto notable.

Estás haciendo cualquier trabajo que dependa del conocimiento de desarrollos posteriores a mediados de 2025. Este modelo no lo sabe.

Estás comenzando un nuevo desarrollo que toca el tier mini. No comiences aquí; comienza en un mini más nuevo.

Estás ejecutando clasificación o extracción asistida por visión y has estado golpeando el techo de calidad del codificador de visión de esta generación.

Cuándo diferir la migración

Omite la migración si el modelo está cumpliendo tus barras de calidad limpiamente y la estabilidad operacional es genuinamente valiosa, especialmente para integraciones heredadas donde el costo de cualquier cambio es alto.

Omítela para cargas de trabajo donde has calibrado estrechamente las herramientas posteriores contra los patrones de salida específicos de este modelo y el reajuste es costoso.

Vigila los anuncios de depreciación. OpenAI eventualmente retirará los slugs de tier pequeño más antiguos, lo cual es la función forzadora independientemente de la preferencia.

La migración en sí

La migración de GPT-5 Mini a un Mini más nuevo en la misma familia — 5.2 Mini, 5.4 Mini, 5.5 Mini — suele ser sencilla. Los patrones de salida son ampliamente compatibles. La mayoría de los prompts funcionan con ajustes menores. La mayor parte del trabajo es la revalidación contra tu suite de evaluación y la actualización de cualquier análisis posterior que dependa de peculiaridades de formato específicas.

Fija la instantánea fechada del Mini al que migres. El argumento de reproducibilidad se aplica a las fijaciones de tier mini más de lo que la gente asume — consulta la discusión dedicada sobre las instantáneas de mini fechadas.

El patrón de dos slugs se aplica como en otros lugares: instantánea fechada en producción, slug flotante en pre-lanzamiento con una suite canario para capturar regresiones antes de que se envíen.

Notas operacionales

Para cargas de trabajo de muy alto volumen, la brecha de costo entre minis viejos y nuevos puede importar más que la brecha de calidad. Haz los cálculos en tu uso real. Los minis más nuevos son a menudo más baratos por salida útil incluso cuando el precio por token es similar.

Para cargas de trabajo que han estado en Mini el tiempo suficiente como para que nadie recuerde por qué, la revisión periódica es saludable. Confirma que la carga de trabajo todavía necesita mini en absoluto — muchas de ellas han crecido para merecer base, o se han reducido para caber en nano.

Alternativas

Para nuevos despliegues, no comiences aquí. Comienza en un mini de generación actual.

Para cargas de trabajo que necesitan comportamiento de mini fijado en un proveedor diferente, las ofertas comparables de tier pequeño de Anthropic y Google se envían con el mismo patrón de instantánea fechada.

Para cargas de trabajo optimizadas para costo donde el ajuste del ecosistema de OpenAI no es fundamental, los modelos pequeños de pesos abiertos ejecutándose en tu propia infraestructura pueden igualar el mini de esta generación a menor costo marginal más allá del gasto de GPU.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

Comparación de proveedoresLIVE

Comparación de proveedores

Compara cada proveedor de este modelo — coste base, calidad, latencia y disponibilidad.

Azure OpenAI (EU - Sweden)UE

Coste de entrada✓ mejor$0.2500

Coste de salida$2.00

CalidadAún sin probar

Latencia (p50)Aún sin probar

DisponibilidadAún sin probar

Costes por 1M de tokens (coste base)

OpenAIEE. UU.Esta oferta

Coste de entrada$0.2500

Coste de salida$2.00

CalidadAún sin probar

Latencia (p50)✓ mejor695 ms

DisponibilidadAún sin probar

Costes por 1M de tokens (coste base)

Inteligencia de consenso

TODO EL MODELO

Las señales de consenso son de todo el modelo — todavía no por proveedor.

—

Utilidad del agente (1–10)

—

Puntuación de precisión

Detecciones únicas

Solicitudes validadas

Votos de la comunidadLIVE

Votos de la comunidad

Lo que opinan los visitantes reales — por proveedor.

Azure OpenAI (EU - Sweden)UE

Aún no hay votos de la comunidad.

OpenAIEE. UU.

Aún no hay votos de la comunidad.

Más resultados — por proveedor

Calidad por categoría

Rúbrica de juego

Aún sin datos.

Veredicto del juez

■ OK 62%■ Parcial 0%■ Incorrecto 38%

Juegos y arena

Aún sin datos.

Velocidad y salud

695 ms

Latencia (p50)

—

Disponibilidad

Calidad por categoría

Rúbrica de juego

Aún sin datos.

Veredicto del juez

■ OK 62%■ Parcial 0%■ Incorrecto 38%

Juegos y arena

Aún sin datos.

Velocidad y salud

695 ms

Latencia (p50)

—

Disponibilidad

Pregunta y respuesta — explorarLIVE

1 de 80

🧠 inteligenciaOpenAImultilingual · 2026-07-26puntuación: 100

Bir mağazada %20 indirim uygulanıyor. 150 TL olan bir ürün indirimden sonra kaç TL olur?

%20 indirim demek fiyatın %80'ine düşmesi demektir. 150 × (1 − 0,20) = 150 × 0,80 = 120 Cevap: 120 TL.

Historial de pruebas — todos los proveedoresLIVE

Puntuación de calidad en el tiempoúltimo 54

Velocidad — latencia p50 en el tiempoúltimo 663 ms

📝Veredicto — resumenLIVE

Quality drops 31 points while latency improves; reasoning capability lost

🖼️Imagen y explicaciónLIVE

gpt-5-mini

Capacidades

La trampa del "el mini viejo aún funciona bien"

Lo que este modelo todavía hace

Bajo el capó

Dónde se sitúa hoy

Dónde se muestran los límites

Cuándo migrar

Cuándo diferir la migración

La migración en sí

Notas operacionales

Alternativas

📊Comparación de proveedoresLIVE

🧠Inteligencia de consenso

👥Votos de la comunidadLIVE

🔬Más resultados — por proveedor

💬Pregunta y respuesta — explorarLIVE

🗂️Historial de pruebas — todos los proveedoresLIVE

Veredicto — resumenLIVE

Imagen y explicaciónLIVE

Comparación de proveedoresLIVE

Inteligencia de consenso

Votos de la comunidadLIVE

Más resultados — por proveedor

Pregunta y respuesta — explorarLIVE

Historial de pruebas — todos los proveedoresLIVE