Aller au contenu
Tier C — Spécialiste
Fonctionne en :FranceCréé en :France
OVH AI Endpoints (GRA)

Mistral-Small-3.2-24B-Instruct-2506

Tier C — Spécialiste

Équipe éditoriale Tokonomix·Relu par Mes Kalkan··

Mistral-Small-3.2-24B-Instruct-2506 est un modèle de langage compact développé par Mistral AI et mis à disposition via OVH AI Endpoints dans la région GRA (Gravelines). Faisant partie de la famille de modèles affinés par instructions de Mistral, il est conçu pour suivre des instructions en langage naturel et gérer des tâches de génération de texte polyvalentes. L'architecture de 24 milliards de paramètres le positionne comme une option légère au sein du portefeuille de Mistral, offrant un équilibre entre efficacité computationnelle et capacité pour les workflows standard de compréhension et génération linguistiques. Ce modèle est optimisé pour des tâches incluant les questions-réponses, la synthèse, la génération de contenu et les opérations de raisonnement élémentaire. La méthodologie d'affinage par instructions lui permet d'interpréter les requêtes utilisateur de manière plus fiable que les modèles de base, le rendant adapté aux applications où la réalisation directe de tâches prime sur l'expertise spécialisée dans un domaine. La désignation 2506 indique sa chronologie de publication dans le schéma de versionnement de Mistral, reflétant les mises à jour des données d'entraînement et des procédures d'alignement actuelles à mi-2025. Au sein de l'écosystème OVH AI Endpoints, Mistral-Small-3.2-24B-Instruct-2506 sert de point d'accès accessible pour les développeurs nécessitant des capacités de modèle de langage standard sans la surcharge de ressources des modèles plus volumineux. Le déploiement d'infrastructure d'OVH à Gravelines fournit un hébergement basé en Europe, ce qui peut être pertinent pour les considérations de latence et les exigences de résidence des données. Le modèle fonctionne comme un outil polyvalent pour les applications où des tâches linguistiques de complexité modérée suffisent, se situant en dessous des variantes moyennes et grandes de Mistral en termes d'échelle et de spécialisation.

Mistral Small 3.2 24B est un modèle compact et efficace de Mistral AI, accessible via OVH pour les déploiements européens.

Synthèse benchmark Tokonomix
Section 01

Analyse de vitesse

Latence mesurée sur toutes les exécutions de benchmark. P50 (médiane) et P95 (95e percentile) donnent une image réaliste de la vitesse de réponse en charge normale et de pointe.

Latence P50 (médiane)Latence P9569 runs
63132325833843510305-1105-27ms
Section 02

Historique des tarifs

Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.

💰
Tarifs API — Mistral-Small-3.2-24B-Instruct-2506
$0.2000 par 1M de tokens d'entrée
$0.6000 par 1M de tokens de sortie
≈ $0.0002 par conversation typique (800 tokens)
Prix entrée vs sortie (par 1M de tokens)
par 1M de tokens d'entrée$0.2000
par 1M de tokens de sortie$0.6000

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.2000

input / 1M

— no change

$0.6000

output / 1M

— no change

2026-05-242026-05-242026-05-24
Input
Output
Price change
⟳ synced weekly
Section 03

Tokens par seconde

Débit en tokens par seconde, dérivé de la latence P50 mesurée. Plus haut est mieux ; les fluctuations reflètent la charge côté fournisseur.

Débit (tokens / s)1786 / avg 1923
309987

Estimé à partir de la latence P50 × 200 tokens de sortie — le chiffre absolu dépend de cette hypothèse ; c'est la tendance qui compte.

Section 04

Forces & faiblesses

Basé sur les résultats de benchmarks et les retours communautaires agrégés sur des cas d'usage réels.

Forces

24B paramètres équilibrésHébergement européen OVHInstruction-following précisDonnées en infrastructure UEBon rapport efficacité-performanceAdapté aux applications standards

Faiblesses

Moins puissant que les modèles 70BLimites sur analyses très complexesContexte non précisé pour ce déploiementQualité inférieure aux modèles Mistral Large
Section 05

Capacités

ownedBy: mistralai
Section 06

Questions fréquentes

Small se positionne entre les modèles légers 7B et les modèles Large, offrant un bon équilibre pour les tâches professionnelles courantes.

L équilibre Mistral entre efficacité et performance dans un modèle 24B hébergé en infrastructure européenne.

Synthèse benchmark Tokonomix
Section 07

Verdicts benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-598/100 · 5 runs
5 correct0 partial0 wrong100% accuracy
2026-05-24

Référence établie pour Mistral Small 3.2 24B

Ce verdict établit la performance de référence initiale pour Mistral Small 3.2 24B Instruct déployé via OVH AI Endpoints dans la région GRA. S'agissant d'une première évaluation, aucune métrique comparative ne permet d'apprécier l'évolution dans le temps. Le modèle représente l'offre de gamme réduite de Mistral AI au sein de sa génération 3.2, avec 24 milliards de paramètres et des optimisations par instruction-tuning. Les utilisateurs doivent noter que ce déploiement est spécifique au datacenter d'OVH à Gravelines, ce qui peut influencer la latence selon la localisation géographique des bases d'utilisateurs. Les verdicts futurs suivront la constance des performances, les variations de qualité des réponses et tout changement dans les métriques de capacité. Le nombre de 24B paramètres positionne ce modèle comme une option de milieu de gamme, potentiellement équilibrée entre efficacité computationnelle et étendue des capacités. Les organisations évaluant ce endpoint doivent mener leurs propres tests applicatifs pour déterminer son adéquation à leurs cas d'usage, les bases de référence initiales offrant un éclairage limité en l'absence de données longitudinales. Les fenêtres de benchmark suivantes révéleront si la performance reste stable ou présente des variations selon les conditions de charge et les schémas de requêtes.

Quality

Latency p50

Test runs

0

Indicateurs de référence établis Déploiement régional confirmé
Section 08

Profil complet du modèle

mistral-small-3.2-24b-instruct-2506 — illustration 1
Mistral Small 3.2 24B Instruct sur OVH AI Endpoints

Mistral Small 3.2 est la mise à jour de juin 2025 de la lignée Mistral Small à 24 milliards de paramètres. OVH AI Endpoints le sert depuis une infrastructure française. Pour les équipes européennes à la recherche d'un modèle de poids moyen-lourd qui ne se situe pas tout à fait au coût des modèles phares et qui n'est pas non plus confiné dans l'enveloppe des petits modèles, celui-ci occupe une niche intermédiaire intéressante.

Ce que c'est

La version « 3.2 » est une itération affinée de Mistral Small 3.1, qui avait déjà porté la lignée à un niveau compétitif de raisonnement de milieu de gamme et de suivi d'instructions. Le suffixe 2506 est l'horodatage de la version publiée. La ligne Small 3.x porte les choix architecturaux effectués par Mistral à travers leur travail de deuxième génération, incluant des améliorations au suivi d'instructions, à la fiabilité des sorties structurées et à la stabilité de l'utilisation d'outils.

En ce qui concerne la modalité, traitez le endpoint OVH comme orienté texte d'abord, à moins que vous n'ayez explicitement vérifié la vision par rapport à votre propre flux de travail. La lignée 3.x de Mistral a livré des variantes capables de vision et le paysage a évolué d'une version ponctuelle à l'autre, donc la position de sécurité par défaut consiste à planifier pour du texte en entrée et du texte en sortie et à tester l'entrée d'image uniquement après avoir confirmé le comportement par rapport à la version spécifique de l'endpoint qu'OVH exécute actuellement.

La fenêtre de contexte est généreuse pour cette classe de taille. L'appel d'outils et la sortie JSON sont suffisamment fiables pour construire de véritables systèmes agentiques dessus, avec la réserve habituelle que toute utilisation en production de sorties structurées nécessite un validateur derrière.

Où il excelle

Mistral Small 3.2 frappe dans le mille lorsque vous avez besoin d'un véritable raisonnement sans payer pour un modèle de classe 70B. Les tâches qui mêlent le suivi d'instructions structurées, un raisonnement léger et la génération de contenu multilingue sont son point fort. Le modèle maintient une voix cohérente à travers des réponses plus longues et suit les orientations de style sans dériver.

Les performances multilingues sont bonnes dans les principales langues européennes, particulièrement en français, où à la fois les données d'entraînement de Mistral et les choix de tokeniseur penchent en sa faveur. L'allemand, l'italien, l'espagnol et le portugais sont solides. La couverture des langues européennes plus petites est utilisable mais variable.

La génération de code est compétente dans les langages grand public. L'appel de fonctions est fiable, avec une sortie JSON stable et une orchestration multi-outils correcte. Pour les flux de travail agentiques qui nécessitent un modèle de milieu de gamme, c'est l'une des meilleures options à ce niveau de prix.

Où il échoue

Ce n'est pas un modèle de frontière. Les benchmarks de raisonnement les plus difficiles favorisent encore les modèles à poids fermés plus lourds. La planification longue et en plusieurs étapes qui nécessite de tenir compte de nombreuses contraintes à l'esprit peut dériver. Les mathématiques au-delà d'une complexité modérée ne sont pas fiables. Le code dans des langages inhabituels ou avec des exigences de justesse subtiles doit être examiné.

La tendance à la verbosité qui traverse la lignée Mistral est présente. Demandez de la concision dans le prompt lorsque vous en avez besoin et imposez-la avec des limites de jetons si nécessaire.

Pour les charges de travail visuelles, ne présumez pas de la capacité sans vérification. Si votre cas d'usage est centré sur l'image, regardez les endpoints explicitement construits pour cela, tels que la ligne vision-langage Qwen dans le catalogue OVH ou un fournisseur avec une API vision documentée.

La position OVH et européenne

OVH héberge l'inférence depuis Gravelines ou Roubaix. Infrastructure française, DPA européen, aucun entraînement sur les prompts des clients. Pour les charges de travail de poids moyen-lourd où la conversation d'approvisionnement inclut des exigences de résidence des données, c'est l'une des options crédibles. Le catalogue de modèles de classe 24B avec cette histoire d'hébergement est plus restreint que le catalogue de petits modèles.

La surface d'API compatible OpenAI maintient la friction d'intégration faible. Les SDK existants, les bibliothèques d'orchestration et les frameworks d'agents se branchent sans réécriture.

Tarification

Listée sur la page OVH AI Endpoints. Tarifs de milieu de gamme. Nous ne les republions pas car ils évoluent et nous préférons que vous consultiez la source. Généralement, la classe 24B se situe confortablement au-dessus des modèles 7-12B et bien en dessous de la classe 70B sur le coût par appel.

Choisir ceci versus les alternatives

Si vous avez besoin d'un véritable raisonnement de milieu de gamme avec résidence européenne : mettez celui-ci sur votre liste restreinte. Si votre trafic se situe principalement dans la zone de confort d'un modèle plus petit : payez le coût par appel inférieur et utilisez Mistral 7B ou Llama 3.1 8B à la place. Si vous avez besoin de qualité haut de gamme et avez de la marge dans le budget : montez à la classe 70B. Si la vision est dans le périmètre : confirmez d'abord le comportement de l'endpoint, ou choisissez un modèle dont le support vision est explicite.

Un schéma pratique : par défaut petit modèle plus Mistral Small 3.2 en escalade fonctionne bien pour le support et les pipelines de contenu. Le point de division dépend de vos prompts réels et de votre tolérance à la mauvaise classification.

Comparez sur les mêmes prompts via le classement ; voir méthodologie pour ce que nous mesurons ; répartition multilingue sur /benchmarks/languages.

Conclusion

Un modèle solide de milieu de gamme affiné pour les instructions par Mistral, servi sur une infrastructure française, actualisé assez récemment pour rester compétitif. Mistral Small 3.2 est l'un des choix par défaut les plus pratiques pour les équipes européennes qui ont besoin d'un véritable raisonnement, de qualité multilingue et d'un historique de résidence documenté sans escalader vers le niveau poids lourd.

Dernière revue technique : 2026-05-22 — Tokonomix.ai

mistral-small-3.2-24b-instruct-2506 — illustration 2
Dernier test automatisé
27 mai 2026 · 21:44 UTC · Benchmark de vitesse
Latence P50
112 ms
Latence P95
129 ms
Erreurs
0 / 6 exécutions
Dernière revue par Équipe Tokonomix·26 mai 2026