¿En qué se diferencia Small de otros modelos Mistral?

Small posiciona a este modelo por debajo de Medium y Large en la jerarquía de Mistral, siendo más eficiente pero menos potente.

¿Para qué tipo de empresas es ideal?

PYMES y equipos europeos que necesitan capacidades de IA sólidas con cumplimiento de residencia de datos sin infraestructura propia.

¿Puede reemplazar a Mistral 7B para casos más exigentes?

Sí, con 24B parámetros tiene mayor capacidad que los modelos de 7B para tareas de complejidad media.

Tier C — Especialista

Se ejecuta en:FranceCreado en:France

OVH AI Endpoints (GRA)

Mistral-Small-3.2-24B-Instruct-2506

Tier C — Especialista

Equipo editorial Tokonomix·Revisado por Mes Kalkan·Publicado 22 de mayo de 2026·Última revisión 26 de mayo de 2026

Mistral-Small-3.2-24B-Instruct-2506 es un modelo de lenguaje compacto desarrollado por Mistral AI y disponible a través de OVH AI Endpoints en la región GRA (Gravelines). Como parte de la familia de modelos ajustados por instrucciones de Mistral, está diseñado para seguir instrucciones en lenguaje natural y manejar tareas de generación de texto de propósito general. La arquitectura de 24 mil millones de parámetros lo posiciona como una opción ligera dentro del portafolio de Mistral, ofreciendo un equilibrio entre eficiencia computacional y capacidad para flujos de trabajo estándar de comprensión y generación de lenguaje. Este modelo está optimizado para tareas que incluyen respuesta a preguntas, resumen, generación de contenido y operaciones básicas de razonamiento. La metodología de ajuste por instrucciones le permite interpretar las indicaciones del usuario de manera más confiable que los modelos base, haciéndolo adecuado para aplicaciones donde se prioriza la completación directa de tareas sobre la experiencia especializada en dominios específicos. La designación 2506 indica su cronología de lanzamiento dentro del esquema de versionado de Mistral, reflejando actualizaciones a los datos de entrenamiento y procedimientos de alineación vigentes a mediados de 2025. Dentro del ecosistema OVH AI Endpoints, Mistral-Small-3.2-24B-Instruct-2506 sirve como un punto de entrada accesible para desarrolladores que requieren capacidades estándar de modelo de lenguaje sin la sobrecarga de recursos de modelos más grandes. El despliegue de infraestructura de OVH en Gravelines proporciona alojamiento con base europea, lo cual puede ser relevante para consideraciones de latencia y requisitos de residencia de datos. El modelo funciona como una herramienta de propósito general para aplicaciones donde tareas de lenguaje de complejidad moderada son suficientes, ubicándose por debajo de las variantes medianas y grandes de Mistral en términos de escala y especialización.

Prueba Mistral-Small-3.2-24B-Instruct-2506 con tus propias preguntas

Mistral Small 3.2 24B Instruct combina 24B parámetros con instrucción fina de 2025 para ofrecer capacidades equilibradas en infraestructura europea de OVH.
— Resumen de benchmark Tokonomix

Sección 01

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰

Tarifas API — Mistral-Small-3.2-24B-Instruct-2506

$0.2000 por 1M de tokens de entrada

$0.6000 por 1M de tokens de salida

≈ $0.0002 por conversación típica (800 tokens)

Precio entrada vs salida (por 1M de tokens)

por 1M de tokens de entrada$0.2000

por 1M de tokens de salida$0.6000

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.2000

input / 1M

— no change

$0.6000

output / 1M

— no change

2026-05-242026-05-242026-05-24

Input

Output

Price change

⟳ synced weekly

Sección 02

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Proveedor y hosting europeoBalance rendimiento-eficiencia en 24BAjuste fino instrucciones mid-2025Generación de texto versátilAcceso sin gestionar infraestructuraMultilingüe competente

Debilidades

Inferior en razonamiento complejo vs modelos mayoresContexto no documentado para este despliegueAnálisis avanzado puede requerir más parámetrosMenor velocidad que modelos de 7B

Sección 03

Capacidades

ownedBy: mistralai

Sección 04

Preguntas frecuentes

Indica la fecha de versión o entrenamiento: junio de 2025 en la nomenclatura Mistral.

Una opción compacta pero capaz de Mistral AI para organizaciones que buscan eficiencia sin sacrificar calidad de respuesta.
— Resumen de benchmark Tokonomix

Sección 05

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 06

Veredictos del benchmark Tokonomix

⚖️

Endorsed by 1 judge

Independent LLM judges evaluated this model on our weekly intelligence tests

claude-sonnet-4-598/100 · 5 runs

5 correct0 partial0 wrong100% accuracy

● 2026-05-24

Línea base establecida para Mistral Small 3.2 24B

Este veredicto establece la línea base inicial de rendimiento para Mistral Small 3.2 24B Instruct desplegado a través de OVH AI Endpoints en la región GRA. Al tratarse de una primera evaluación, no existen métricas comparativas para valorar cambios a lo largo del tiempo. El modelo representa la oferta de gama pequeña de Mistral AI dentro de su línea generacional 3.2, con 24 mil millones de parámetros y optimizaciones de ajuste por instrucciones. Conviene señalar que este despliegue es específico de la región de infraestructura del centro de datos de OVH en Gravelines, lo que puede influir en las características de latencia para distintas bases geográficas de usuarios. Los veredictos futuros harán seguimiento de la consistencia del rendimiento, las variaciones en la calidad de las respuestas y cualquier cambio en las métricas de capacidad. El recuento de 24B parámetros posiciona a este modelo como una opción de gama media, equilibrando potencialmente la eficiencia computacional con la amplitud de capacidades. Las organizaciones que evalúen este endpoint deberían realizar sus propias pruebas específicas para determinar su idoneidad según el caso de uso, ya que las líneas base iniciales ofrecen información limitada sin datos longitudinales. Las próximas ventanas de benchmark revelarán si el rendimiento se mantiene estable o presenta varianza bajo distintas condiciones de carga y patrones de consulta.

Quality

—

Latency p50

—

Test runs

✓ Métricas de referencia establecidas✓ Despliegue regional confirmado

Sección 07

Perfil completo del modelo

Mistral Small 3.2 24B Instruct en OVH AI Endpoints

Mistral Small 3.2 es la actualización de junio de 2025 de la línea Mistral Small de 24 mil millones de parámetros. OVH AI Endpoints lo sirve desde infraestructura francesa. Para equipos europeos que buscan un modelo de peso medio que no alcanza el costo de los modelos insignia ni queda atrapado en el sobre de los modelos pequeños, este ocupa un espacio intermedio interesante.

Qué es

La versión "3.2" es una iteración afinada sobre Mistral Small 3.1, que ya había llevado la línea a un nivel competitivo de razonamiento de nivel medio y seguimiento de instrucciones. El sufijo 2506 es la marca de fecha de lanzamiento. La línea Small 3.x incorpora las decisiones arquitectónicas que Mistral tomó a través de su trabajo de segunda generación, incluyendo mejoras en el seguimiento de instrucciones, fiabilidad de salidas estructuradas y estabilidad en el uso de herramientas.

En cuanto a modalidad, trata el endpoint de OVH como orientado a texto primero a menos que hayas verificado explícitamente la capacidad de visión contra tu propio flujo de trabajo. La línea 3.x de Mistral ha lanzado variantes capaces de procesar visión y el panorama ha cambiado a través de lanzamientos puntuales, así que el valor predeterminado seguro es planificar para texto de entrada y texto de salida y probar la entrada de imagen solo después de confirmar el comportamiento contra la versión específica del endpoint que OVH está ejecutando actualmente.

La ventana de contexto es generosa para la clase de tamaño. El llamado de herramientas y la salida JSON son lo suficientemente confiables como para construir sistemas agénticos reales sobre ellas, con la advertencia habitual de que cualquier uso en producción de salida estructurada necesita un validador detrás.

Dónde destaca

Mistral Small 3.2 da en el clavo cuando necesitas razonamiento real sin pagar por un modelo de clase 70B. Las tareas que mezclan seguir instrucciones estructuradas, razonamiento ligero y generación de contenido multilingüe son su punto óptimo. El modelo mantiene una voz coherente a través de respuestas más largas y sigue la guía de estilo sin desviarse.

El rendimiento multilingüe es bueno en los principales idiomas europeos, particularmente en francés, donde tanto los datos de entrenamiento de Mistral como las decisiones del tokenizador se inclinan. Alemán, italiano, español y portugués son sólidos. La cobertura de idiomas europeos más pequeños es viable pero variable.

La generación de código es competente en lenguajes de programación principales. El llamado de funciones es confiable, con salida JSON estable y orquestación decente de múltiples herramientas. Para flujos de trabajo agénticos que necesitan un modelo en el nivel medio, esta es una de las mejores opciones en ese rango de precio.

Dónde se queda corto

No es un modelo de frontera. Los benchmarks de razonamiento más difíciles todavía favorecen modelos más pesados de pesos cerrados. La planificación larga y de múltiples pasos que requiere mantener muchas restricciones en mente puede desviarse. Las matemáticas más allá de complejidad moderada no son confiables. El código en lenguajes inusuales o con requisitos sutiles de corrección debe ser revisado.

La tendencia a la verbosidad que recorre la línea Mistral está presente. Solicita concisión cuando la necesites y refuérzala con límites de tokens si es necesario.

Para cargas de trabajo de visión, no asumas capacidad sin verificación. Si tu caso de uso está orientado a imagen primero, mira endpoints construidos explícitamente para eso, como la línea de visión-lenguaje Qwen en el catálogo de OVH o un proveedor con una API de visión documentada.

La posición de OVH y la UE

OVH aloja la inferencia desde Gravelines o Roubaix. Infraestructura francesa, DPA europeo, sin entrenamiento sobre prompts de clientes. Para cargas de trabajo de peso medio donde la conversación de adquisición incluye requisitos de residencia de datos, esta es una de las opciones creíbles. El catálogo de modelos de clase 24B con esta historia de alojamiento es más estrecho que el catálogo de modelos pequeños.

La superficie de API compatible con OpenAI mantiene baja la fricción de integración. SDKs existentes, bibliotecas de orquestación y frameworks de agentes se conectan sin reescrituras.

Precios

Listados en la página de OVH AI Endpoints. Tarifas de nivel medio. No las republicamos porque cambian y preferimos que consultes la fuente. Generalmente, la clase 24B se sitúa cómodamente por encima de los modelos 7-12B y muy por debajo de la clase 70B en costo por llamada.

Elegir esto frente a alternativas

Si necesitas razonamiento real de nivel medio con residencia en la UE: incluye esto en tu lista corta. Si tu tráfico está mayormente dentro de la zona de confort de un modelo más pequeño: paga el menor costo por llamada y usa Mistral 7B o Llama 3.1 8B en su lugar. Si necesitas calidad de primera línea y tienes margen en el presupuesto: sube a la clase 70B. Si la visión está en el alcance: confirma el comportamiento del endpoint primero, o elige un modelo cuyo soporte de visión sea explícito.

Un patrón práctico: predeterminado de modelo pequeño más Mistral Small 3.2 en escalamiento funciona bien para soporte y pipelines de contenido. El punto de división depende de tus prompts reales y tu tolerancia a la clasificación errónea.

Compara con los mismos prompts a través de la tabla de clasificación; consulta la metodología para saber qué medimos; desglose multilingüe en /benchmarks/languages.

Conclusión

Un modelo sólido de nivel medio afinado para instrucciones de Mistral, servido en infraestructura francesa, actualizado lo suficientemente reciente como para permanecer competitivo. Mistral Small 3.2 es uno de los valores predeterminados más prácticos para equipos europeos que necesitan razonamiento real, calidad multilingüe y una historia de residencia documentada sin escalar al nivel de peso pesado.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

Última prueba automática

27 may 2026 · 21:44 UTC · Benchmark de velocidad

Latencia P50

112 ms

Latencia P95

129 ms

Errores

0 / 6 ejecuciones

Última revisión por Equipo Tokonomix·26 de mayo de 2026