Tier C — Especialista

Se ejecuta en:USCreado en:United States

$0.6000

salida · por 1M de tokens (coste base)

Coste

1,097 ms

Velocidad de respuesta

100 / 100

Inteligencia

Veredicto — resumenLIVE

● LIVE

ahora · 2026-07-26

Eighth window: Capability expansion with tools, vision, and structured outputs

✓ Tool calling support added✓ Vision input now supported✓ JSON schema structured outputs✓ PDF processing capability added

GPT-4o Mini enters its eighth benchmark window with significant capability additions while maintaining its core identity as a compact model. The most notable changes include the introduction of tool calling, vision input processing, and advanced structured output modes including JSON schema support and parallel tool execution. PDF input capability has also been added, expanding the model's document processing range. Prompt caching support suggests infrastructure optimizations for repeated context handling. These additions transform the model from a text-only processor into a multimodal assistant capable of handling diverse input types and producing structured outputs. The benchmark data shows no performance metrics for this window, making it impossible to assess whether these new capabilities come with any trade-offs in speed, accuracy, or other measurable attributes. Users gain access to a substantially more versatile model that can now participate in tool-augmented workflows and process visual information alongside text. The lack of comparative performance data means adopters should conduct their own testing to understand how these capabilities perform in production scenarios and whether they meet specific application requirements.

Quality

—

Latency p50

—

Test runs

1 de 18

Imagen y explicaciónLIVE

OpenAI

gpt-4o-mini-2024-07-18

Tier C — Especialista

Equipo editorial Tokonomix·Revisado por Mes Kalkan·Publicado 22 de mayo de 2026·Última revisión 26 de mayo de 2026

GPT-4o-mini-2024-07-18 es un modelo de lenguaje compacto desarrollado por OpenAI, lanzado en julio de 2024 como parte de la familia de modelos GPT-4o. Representa una variante más pequeña y eficiente de la arquitectura GPT-4o, diseñada para proporcionar generación de texto capaz mientras requiere menos recursos computacionales que sus contrapartes más grandes. El modelo mantiene la base de arquitectura multimodal de la serie GPT-4o, aunque esta variante se enfoca principalmente en tareas basadas en texto. Este modelo está diseñado para aplicaciones que requieren capacidades estándar de generación de texto con latencia y requisitos de recursos reducidos. Maneja tareas como creación de contenido, respuesta a preguntas, resumen, generación de código e interacciones conversacionales. La designación "mini" indica su posición como una opción más ligera adecuada para casos de uso donde las capacidades completas de modelos más grandes pueden no ser necesarias, haciéndolo apropiado para aplicaciones de mayor volumen o escenarios de despliegue con restricciones de recursos. Dentro de la línea de modelos de OpenAI, GPT-4o-mini se sitúa por debajo de los modelos insignia GPT-4o y GPT-4 Turbo en términos de capacidad, ofreciendo un equilibrio entre rendimiento y eficiencia. Sucedió a modelos compactos anteriores en el portafolio de OpenAI, proporcionando características de rendimiento mejoradas en comparación con alternativas basadas en GPT-3.5 mientras mantiene accesibilidad para una gama más amplia de aplicaciones. El modelo representa el esfuerzo continuo de OpenAI de ofrecer opciones variadas a través de diferentes perfiles de rendimiento y eficiencia.

Prueba gpt-4o-mini-2024-07-18 con tus propias preguntas

GPT-4o-mini se posiciona como la opción ligera de OpenAI para equipos que necesitan respuestas rápidas y económicas sin renunciar a la calidad básica de la familia GPT-4o.
— Resumen editorial de Tokonomix

Capacidades

toolssource: litellmvisionjson modepdf inputjson schemaparallel toolsprompt cachingmax output tokens: 16384

gpt-4o-mini-2024-07-18: la congelación mini original

gpt-4o-mini-2024-07-18 es la instantánea fechada de julio de 2024 del modelo GPT-4o pequeño de OpenAI. La primera congelación estable de la línea mini. La que se lanzó cuando OpenAI retiró gpt-3.5-turbo del espacio de modelo-barato-por-defecto y colocó mini en su lugar.

Esto es lo que fijas cuando "gpt-4o-mini" avanzó y rompió algo para ti, o cuando un contrato downstream requiere el comportamiento exacto del lanzamiento original.

Qué es esta instantánea

La congelación de julio de 2024 es la instantánea mini inaugural. Para ese lanzamiento el modelo había:

Asentado la ventana de contexto de 128k que se ha mantenido constante en toda la línea.
Bloqueado el soporte de entrada de visión como una capacidad estándar en lugar de un endpoint separado.
Establecido la ergonomía de uso de herramientas que las instantáneas mini más nuevas heredaron.

Lo que no tiene, en relación con el alias rodante a mediados de 2026:

El pulido de seguimiento de instrucciones que las instantáneas mini posteriores añadieron.
Las mejoras de fiabilidad de salida estructurada que llegaron a través de las revisiones de 2025.
Los refinamientos de postura de rechazo que suavizaron la cautela excesiva ocasional del lanzamiento original.

Para un despliegue de producción que fue construido y validado contra esta instantánea exacta, esas brechas pueden ser el tipo equivocado de "mejora" — te estabilizaste en un comportamiento específico, y avanzar significa revalidar todo.

Cuándo la fijación fechada vale la pena

El caso para quedarse con 2024-07-18 en lugar del alias rodante gpt-4o-mini es el mismo que para cualquier instantánea fechada: intercambias acceso a mejoras por predictibilidad de comportamiento.

Situaciones concretas donde la fijación rinde frutos:

Cargas de trabajo reguladas con evidencia de versión del modelo en el rastro de auditoría. El oficial de cumplimiento quiere el mismo comportamiento del modelo mañana que la documentación describe hoy. La instantánea fechada es lo que hace esa promesa honesta.
Pipelines de producción con plantillas de prompts afinadas contra peculiaridades específicas del modelo. Las instantáneas más nuevas pueden manejar el mismo prompt de manera ligeramente diferente — mejor en promedio, peor en los casos extremos para los que tus prompts fueron afinados.
Pruebas A/B de larga duración donde el brazo de control necesita permanecer constante durante meses.
Productos de cara al cliente donde la consistencia de voz y lenguaje de rechazo importa más que las mejoras de calidad incrementales.

Para la mayoría de los demás casos de uso, rodar con el alias es el mejor predeterminado.

Cuándo migrar de ella

El camino de migración honesto es hacia adelante — a una instantánea mini más reciente o a un modelo diferente por completo.

La forma de la decisión:

Vuelve a ejecutar el conjunto de evaluación completo contra el alias rodante actual y contra la instantánea fechada más reciente.
Compara en las métricas que importan para tu producto, no en las métricas de las notas de lanzamiento de OpenAI.
Migra cuando la instantánea más nueva gane en tu evaluación. Quédate cuando no lo haga.

La política de depreciación de OpenAI da aviso anticipado antes de retirar instantáneas fechadas, pero la política es el piso, no el techo. Trata la fijación fechada como un contrato transitorio, no como un hogar permanente.

Dónde falla

Las mismas limitaciones que el resto de la línea mini.

Razonamiento difícil en la frontera. Mini cede terreno aquí a GPT-4o más grande y a la familia GPT-5. La comparación a nivel de categoría está en /benchmarks/leaderboard.

Audio, voz en tiempo real o video. Esos viven en los hermanos especializados.

Despliegue auto-alojado. Sin pesos, sin opción on-prem. La encuesta /usecases/local es la referencia correcta cuando esas limitaciones se imponen.

Robustez adversarial. Los modelos pequeños son objetivos más fáciles para la inyección de prompts que los grandes. Los modelos de clase mini de cualquier proveedor comparten esta debilidad.

Cuándo fijar esta instantánea exacta

Elige gpt-4o-mini-2024-07-18 cuando:

Lanzaste un producto con el comportamiento mini de julio de 2024 y el costo de revalidación contra una instantánea más nueva supera el beneficio.
Un flujo de trabajo regulado requiere fijación de versión a nivel de modelo para propósitos de auditoría.
Una prueba A/B o protocolo de investigación necesita una referencia de modelo fija a lo largo del tiempo.

Omítela cuando:

Estás comenzando desde cero — fija la instantánea mini más reciente en su lugar.
Las mejoras en instantáneas posteriores han ganado demostrablemente en tu arnés de evaluación.
El despliegue puede tolerar el alias rodante y se beneficia de las actualizaciones automáticas.

Notas de despliegue

API estándar de Chat Completions. El comportamiento de uso de herramientas y salida estructurada no ha cambiado desde cómo estaban el día que la instantánea se congeló. La entrada de visión funciona idénticamente en todas las instantáneas mini.

El fine-tuning alojado está soportado, lo que hace de esta instantánea una base razonable para una variante mini afinada si necesitas calidad de dominio estrecho sin pagar costos de inferencia de frontera.

La lectura pragmática. Esta es la primera congelación estable de la línea mini. Sigue usándola cuando la estabilidad de comportamiento sea la prioridad. Muévete a una instantánea más nueva cuando tu evaluación te lo indique, no porque OpenAI lanzó una nota de lanzamiento. Compara lado a lado en /live-test antes de cualquier migración.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

Comparación de proveedoresLIVE

Comparación de proveedores

Compara cada proveedor de este modelo — coste base, calidad, latencia y disponibilidad.

Azure OpenAI (EU - Sweden)UE

Coste de entrada$0.1600

Coste de salida$0.6600

CalidadAún sin probar

Latencia (p50)Aún sin probar

DisponibilidadAún sin probar

Costes por 1M de tokens (coste base)

OpenAIEE. UU.Esta oferta

Coste de entrada✓ mejor$0.1500

Coste de salida$0.6000

Calidad✓ mejor100.0

Latencia (p50)✓ mejor1,097 ms

DisponibilidadAún sin probar

Costes por 1M de tokens (coste base)

Inteligencia de consenso

TODO EL MODELOINACTIVO

Las señales de consenso son de todo el modelo — todavía no por proveedor.

El scoring de consenso aún recopila datos para este modelo — todavía sin señales.

Votos de la comunidadLIVE

Votos de la comunidad

Lo que opinan los visitantes reales — por proveedor.

Azure OpenAI (EU - Sweden)UE

Aún no hay votos de la comunidad.

OpenAIEE. UU.

Aún no hay votos de la comunidad.

Más resultados — por proveedor

Calidad por categoría

Rúbrica de juego

Aún sin datos.

Veredicto del juez

■ OK 80%■ Parcial 12%■ Incorrecto 8%

Juegos y arena

Aún sin datos.

Velocidad y salud

1,097 ms

Latencia (p50)

—

Disponibilidad

Calidad por categoría

Rúbrica de juego

Aún sin datos.

Veredicto del juez

■ OK 80%■ Parcial 12%■ Incorrecto 8%

Juegos y arena

Aún sin datos.

Velocidad y salud

1,097 ms

Latencia (p50)

—

Disponibilidad

Pregunta y respuesta — explorarLIVE

1 de 80

🧠 inteligenciaOpenAImultilingual · 2026-07-26puntuación: 100

Bir mağazada %20 indirim uygulanıyor. 150 TL olan bir ürün indirimden sonra kaç TL olur?

150 TL olan bir üründe %20 indirim uygulanırsa, indirim miktarını hesaplayalım: İndirim miktarı = 150 TL * %20 = 150 TL * 0.20 = 30 TL Bu durumda, indirim sonrası ürünün fiyatı: 150 TL - 30 TL = 120 TL Sonuç olarak, indirimden sonra ürün 120 TL olur.

Historial de pruebas — todos los proveedoresLIVE

Puntuación de calidad en el tiempoúltimo 78

Velocidad — latencia p50 en el tiempo

Aparece una tendencia cuando este modelo se ha probado en varios días distintos.

📝Veredicto — resumenLIVE

Eighth window: Capability expansion with tools, vision, and structured outputs

🖼️Imagen y explicaciónLIVE

gpt-4o-mini-2024-07-18

Capacidades

Qué es esta instantánea

Cuándo la fijación fechada vale la pena

Cuándo migrar de ella

Dónde falla

Cuándo fijar esta instantánea exacta

Notas de despliegue

📊Comparación de proveedoresLIVE

🧠Inteligencia de consenso

👥Votos de la comunidadLIVE

🔬Más resultados — por proveedor

💬Pregunta y respuesta — explorarLIVE

🗂️Historial de pruebas — todos los proveedoresLIVE

Veredicto — resumenLIVE

Imagen y explicaciónLIVE

Comparación de proveedoresLIVE

Inteligencia de consenso

Votos de la comunidadLIVE

Más resultados — por proveedor

Pregunta y respuesta — explorarLIVE

Historial de pruebas — todos los proveedoresLIVE