Ir al contenido
Tier C — Especialista
Se ejecuta en:FranceCreado en:France
OVH AI Endpoints (GRA)

Mistral-Small-3.2-24B-Instruct-2506

Tier C — Especialista

Equipo editorial Tokonomix·Revisado por Mes Kalkan··

Mistral-Small-3.2-24B-Instruct-2506 es un modelo de lenguaje compacto desarrollado por Mistral AI y disponible a través de OVH AI Endpoints en la región GRA (Gravelines). Como parte de la familia de modelos ajustados por instrucciones de Mistral, está diseñado para seguir instrucciones en lenguaje natural y manejar tareas de generación de texto de propósito general. La arquitectura de 24 mil millones de parámetros lo posiciona como una opción ligera dentro del portafolio de Mistral, ofreciendo un equilibrio entre eficiencia computacional y capacidad para flujos de trabajo estándar de comprensión y generación de lenguaje. Este modelo está optimizado para tareas que incluyen respuesta a preguntas, resumen, generación de contenido y operaciones básicas de razonamiento. La metodología de ajuste por instrucciones le permite interpretar las indicaciones del usuario de manera más confiable que los modelos base, haciéndolo adecuado para aplicaciones donde se prioriza la completación directa de tareas sobre la experiencia especializada en dominios específicos. La designación 2506 indica su cronología de lanzamiento dentro del esquema de versionado de Mistral, reflejando actualizaciones a los datos de entrenamiento y procedimientos de alineación vigentes a mediados de 2025. Dentro del ecosistema OVH AI Endpoints, Mistral-Small-3.2-24B-Instruct-2506 sirve como un punto de entrada accesible para desarrolladores que requieren capacidades estándar de modelo de lenguaje sin la sobrecarga de recursos de modelos más grandes. El despliegue de infraestructura de OVH en Gravelines proporciona alojamiento con base europea, lo cual puede ser relevante para consideraciones de latencia y requisitos de residencia de datos. El modelo funciona como una herramienta de propósito general para aplicaciones donde tareas de lenguaje de complejidad moderada son suficientes, ubicándose por debajo de las variantes medianas y grandes de Mistral en términos de escala y especialización.

Mistral Small 3.2 24B Instruct combina 24B parámetros con instrucción fina de 2025 para ofrecer capacidades equilibradas en infraestructura europea de OVH.

Resumen de benchmark Tokonomix
Sección 01

Análisis de velocidad

Latencia medida en todas las ejecuciones de benchmark. P50 (mediana) y P95 (percentil 95) dan una imagen realista de la velocidad de respuesta bajo carga normal y máxima.

Latencia P50 (mediana)Latencia P9569 runs
63132325833843510305-1105-27ms
Sección 02

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰
Tarifas API — Mistral-Small-3.2-24B-Instruct-2506
$0.2000 por 1M de tokens de entrada
$0.6000 por 1M de tokens de salida
≈ $0.0002 por conversación típica (800 tokens)
Precio entrada vs salida (por 1M de tokens)
por 1M de tokens de entrada$0.2000
por 1M de tokens de salida$0.6000

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.2000

input / 1M

— no change

$0.6000

output / 1M

— no change

2026-05-242026-05-242026-05-24
Input
Output
Price change
⟳ synced weekly
Sección 03

Tokens por segundo

Rendimiento en tokens por segundo, derivado de la latencia P50 medida. Más alto es mejor; las fluctuaciones reflejan la carga del lado del proveedor.

Rendimiento (tokens / s)1786 / avg 1923
309987

Estimado a partir de latencia P50 × 200 tokens de salida — el número absoluto depende de esta suposición; lo que importa es la tendencia.

Sección 04

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Proveedor y hosting europeoBalance rendimiento-eficiencia en 24BAjuste fino instrucciones mid-2025Generación de texto versátilAcceso sin gestionar infraestructuraMultilingüe competente

Debilidades

Inferior en razonamiento complejo vs modelos mayoresContexto no documentado para este despliegueAnálisis avanzado puede requerir más parámetrosMenor velocidad que modelos de 7B
Sección 05

Capacidades

ownedBy: mistralai
Sección 06

Preguntas frecuentes

Indica la fecha de versión o entrenamiento: junio de 2025 en la nomenclatura Mistral.

Una opción compacta pero capaz de Mistral AI para organizaciones que buscan eficiencia sin sacrificar calidad de respuesta.

Resumen de benchmark Tokonomix
Sección 07

Veredictos del benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-598/100 · 5 runs
5 correct0 partial0 wrong100% accuracy
2026-05-24

Línea base establecida para Mistral Small 3.2 24B

Este veredicto establece la línea base inicial de rendimiento para Mistral Small 3.2 24B Instruct desplegado a través de OVH AI Endpoints en la región GRA. Al tratarse de una primera evaluación, no existen métricas comparativas para valorar cambios a lo largo del tiempo. El modelo representa la oferta de gama pequeña de Mistral AI dentro de su línea generacional 3.2, con 24 mil millones de parámetros y optimizaciones de ajuste por instrucciones. Conviene señalar que este despliegue es específico de la región de infraestructura del centro de datos de OVH en Gravelines, lo que puede influir en las características de latencia para distintas bases geográficas de usuarios. Los veredictos futuros harán seguimiento de la consistencia del rendimiento, las variaciones en la calidad de las respuestas y cualquier cambio en las métricas de capacidad. El recuento de 24B parámetros posiciona a este modelo como una opción de gama media, equilibrando potencialmente la eficiencia computacional con la amplitud de capacidades. Las organizaciones que evalúen este endpoint deberían realizar sus propias pruebas específicas para determinar su idoneidad según el caso de uso, ya que las líneas base iniciales ofrecen información limitada sin datos longitudinales. Las próximas ventanas de benchmark revelarán si el rendimiento se mantiene estable o presenta varianza bajo distintas condiciones de carga y patrones de consulta.

Quality

Latency p50

Test runs

0

Métricas de referencia establecidas Despliegue regional confirmado
Sección 08

Perfil completo del modelo

mistral-small-3.2-24b-instruct-2506 — illustration 1
Mistral Small 3.2 24B Instruct en OVH AI Endpoints

Mistral Small 3.2 es la actualización de junio de 2025 de la línea Mistral Small de 24 mil millones de parámetros. OVH AI Endpoints lo sirve desde infraestructura francesa. Para equipos europeos que buscan un modelo de peso medio que no alcanza el costo de los modelos insignia ni queda atrapado en el sobre de los modelos pequeños, este ocupa un espacio intermedio interesante.

Qué es

La versión "3.2" es una iteración afinada sobre Mistral Small 3.1, que ya había llevado la línea a un nivel competitivo de razonamiento de nivel medio y seguimiento de instrucciones. El sufijo 2506 es la marca de fecha de lanzamiento. La línea Small 3.x incorpora las decisiones arquitectónicas que Mistral tomó a través de su trabajo de segunda generación, incluyendo mejoras en el seguimiento de instrucciones, fiabilidad de salidas estructuradas y estabilidad en el uso de herramientas.

En cuanto a modalidad, trata el endpoint de OVH como orientado a texto primero a menos que hayas verificado explícitamente la capacidad de visión contra tu propio flujo de trabajo. La línea 3.x de Mistral ha lanzado variantes capaces de procesar visión y el panorama ha cambiado a través de lanzamientos puntuales, así que el valor predeterminado seguro es planificar para texto de entrada y texto de salida y probar la entrada de imagen solo después de confirmar el comportamiento contra la versión específica del endpoint que OVH está ejecutando actualmente.

La ventana de contexto es generosa para la clase de tamaño. El llamado de herramientas y la salida JSON son lo suficientemente confiables como para construir sistemas agénticos reales sobre ellas, con la advertencia habitual de que cualquier uso en producción de salida estructurada necesita un validador detrás.

Dónde destaca

Mistral Small 3.2 da en el clavo cuando necesitas razonamiento real sin pagar por un modelo de clase 70B. Las tareas que mezclan seguir instrucciones estructuradas, razonamiento ligero y generación de contenido multilingüe son su punto óptimo. El modelo mantiene una voz coherente a través de respuestas más largas y sigue la guía de estilo sin desviarse.

El rendimiento multilingüe es bueno en los principales idiomas europeos, particularmente en francés, donde tanto los datos de entrenamiento de Mistral como las decisiones del tokenizador se inclinan. Alemán, italiano, español y portugués son sólidos. La cobertura de idiomas europeos más pequeños es viable pero variable.

La generación de código es competente en lenguajes de programación principales. El llamado de funciones es confiable, con salida JSON estable y orquestación decente de múltiples herramientas. Para flujos de trabajo agénticos que necesitan un modelo en el nivel medio, esta es una de las mejores opciones en ese rango de precio.

Dónde se queda corto

No es un modelo de frontera. Los benchmarks de razonamiento más difíciles todavía favorecen modelos más pesados de pesos cerrados. La planificación larga y de múltiples pasos que requiere mantener muchas restricciones en mente puede desviarse. Las matemáticas más allá de complejidad moderada no son confiables. El código en lenguajes inusuales o con requisitos sutiles de corrección debe ser revisado.

La tendencia a la verbosidad que recorre la línea Mistral está presente. Solicita concisión cuando la necesites y refuérzala con límites de tokens si es necesario.

Para cargas de trabajo de visión, no asumas capacidad sin verificación. Si tu caso de uso está orientado a imagen primero, mira endpoints construidos explícitamente para eso, como la línea de visión-lenguaje Qwen en el catálogo de OVH o un proveedor con una API de visión documentada.

La posición de OVH y la UE

OVH aloja la inferencia desde Gravelines o Roubaix. Infraestructura francesa, DPA europeo, sin entrenamiento sobre prompts de clientes. Para cargas de trabajo de peso medio donde la conversación de adquisición incluye requisitos de residencia de datos, esta es una de las opciones creíbles. El catálogo de modelos de clase 24B con esta historia de alojamiento es más estrecho que el catálogo de modelos pequeños.

La superficie de API compatible con OpenAI mantiene baja la fricción de integración. SDKs existentes, bibliotecas de orquestación y frameworks de agentes se conectan sin reescrituras.

Precios

Listados en la página de OVH AI Endpoints. Tarifas de nivel medio. No las republicamos porque cambian y preferimos que consultes la fuente. Generalmente, la clase 24B se sitúa cómodamente por encima de los modelos 7-12B y muy por debajo de la clase 70B en costo por llamada.

Elegir esto frente a alternativas

Si necesitas razonamiento real de nivel medio con residencia en la UE: incluye esto en tu lista corta. Si tu tráfico está mayormente dentro de la zona de confort de un modelo más pequeño: paga el menor costo por llamada y usa Mistral 7B o Llama 3.1 8B en su lugar. Si necesitas calidad de primera línea y tienes margen en el presupuesto: sube a la clase 70B. Si la visión está en el alcance: confirma el comportamiento del endpoint primero, o elige un modelo cuyo soporte de visión sea explícito.

Un patrón práctico: predeterminado de modelo pequeño más Mistral Small 3.2 en escalamiento funciona bien para soporte y pipelines de contenido. El punto de división depende de tus prompts reales y tu tolerancia a la clasificación errónea.

Compara con los mismos prompts a través de la tabla de clasificación; consulta la metodología para saber qué medimos; desglose multilingüe en /benchmarks/languages.

Conclusión

Un modelo sólido de nivel medio afinado para instrucciones de Mistral, servido en infraestructura francesa, actualizado lo suficientemente reciente como para permanecer competitivo. Mistral Small 3.2 es uno de los valores predeterminados más prácticos para equipos europeos que necesitan razonamiento real, calidad multilingüe y una historia de residencia documentada sin escalar al nivel de peso pesado.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

mistral-small-3.2-24b-instruct-2506 — illustration 2
Última prueba automática
27 may 2026 · 21:44 UTC · Benchmark de velocidad
Latencia P50
112 ms
Latencia P95
129 ms
Errores
0 / 6 ejecuciones
Última revisión por Equipo Tokonomix·26 de mayo de 2026