Zum Inhalt
Tier C — Spezialist
Läuft in:FranceErstellt in:France
OVH AI Endpoints (GRA)

Mistral-Small-3.2-24B-Instruct-2506

Tier C — Spezialist

Tokonomix-Redaktionsteam·Geprüft von Mes Kalkan··

Mistral-Small-3.2-24B-Instruct-2506 ist ein kompaktes Sprachmodell, das von Mistral AI entwickelt und über OVH AI Endpoints in der Region GRA (Gravelines) verfügbar gemacht wurde. Als Teil der Instruction-Tuned-Modellfamilie von Mistral ist es darauf ausgelegt, natürlichsprachlichen Anweisungen zu folgen und allgemeine Textgenerierungsaufgaben zu bewältigen. Die Architektur mit 24 Milliarden Parametern positioniert es als leichtgewichtige Option innerhalb des Mistral-Portfolios und bietet ein Gleichgewicht zwischen Recheneffizienz und Leistungsfähigkeit für standardmäßige Sprachverständnis- und Generierungsabläufe. Dieses Modell ist für Aufgaben wie Frage-Antwort, Zusammenfassung, Inhaltserstellung und grundlegende Reasoning-Operationen optimiert. Die Instruction-Tuning-Methodik ermöglicht es, Nutzerprompts zuverlässiger zu interpretieren als Basismodelle, wodurch es sich für Anwendungen eignet, bei denen unkomplizierte Aufgabenerledigung Vorrang vor spezialisierter Fachkompetenz hat. Die Bezeichnung 2506 gibt den Veröffentlichungszeitpunkt innerhalb des Versionierungsschemas von Mistral an und spiegelt Aktualisierungen der Trainingsdaten und Alignment-Verfahren entsprechend Mitte 2025 wider. Innerhalb des OVH AI Endpoints-Ökosystems dient Mistral-Small-3.2-24B-Instruct-2506 als zugänglicher Einstiegspunkt für Entwickler, die standardmäßige Sprachmodellfähigkeiten ohne den Ressourcenaufwand größerer Modelle benötigen. Die Infrastrukturbereitstellung von OVH in Gravelines bietet europäisches Hosting, was für Latenzerwägungen und Anforderungen an die Datenresidenz relevant sein kann. Das Modell fungiert als Mehrzweckwerkzeug für Anwendungen, bei denen Sprachaufgaben mittlerer Komplexität ausreichen, und liegt unterhalb der mittleren und großen Varianten von Mistral hinsichtlich Umfang und Spezialisierung.

Mistral Small 3.2-24B: 24-Milliarden-Parameter-Instruction-Modell für ausgewogene Leistung auf europäischer OVH-Infrastruktur.

Tokonomix-Benchmark-Zusammenfassung
Abschnitt 01

Geschwindigkeitsanalyse

Latenz über alle Benchmark-Läufe gemessen. P50 (Median) und P95 (95. Perzentil) zeigen ein realistisches Bild der Antwortgeschwindigkeit bei normaler und Spitzenlast.

P50-Latenz (Median)P95-Latenz69 runs
63132325833843510305-1105-27ms
Abschnitt 02

Preisverlauf

Direkte Provider-Tarife pro Million Tokens, plus eine typische Gesprächskostenschätzung.

💰
API-Tarife — Mistral-Small-3.2-24B-Instruct-2506
$0.2000 pro 1M Input-Tokens
$0.6000 pro 1M Output-Tokens
≈ $0.0002 pro typischem Gespräch (800 Tokens)
Input- vs. Output-Preis (pro 1M Tokens)
pro 1M Input-Tokens$0.2000
pro 1M Output-Tokens$0.6000

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.2000

input / 1M

— no change

$0.6000

output / 1M

— no change

2026-05-242026-05-242026-05-24
Input
Output
Price change
⟳ synced weekly
Abschnitt 03

Tokens pro Sekunde

Durchsatz in Tokens pro Sekunde, abgeleitet aus gemessener P50-Latenz. Höhere Werte sind besser; Schwankungen spiegeln die Provider-seitige Last wider.

Durchsatz (Tokens / s)1786 / avg 1923
309987

Geschätzt aus P50-Latenz × 200 Output-Tokens — die absolute Zahl hängt von dieser Annahme ab; entscheidend ist der Trend.

Abschnitt 04

Stärken & Schwächen

Basierend auf Benchmark-Ergebnissen und aggregiertem Community-Feedback zu realen Anwendungsfällen.

Stärken

24B-Parameter-AusgewogenheitInstruction-Tuning 2506OVH Gravelines DatenresidenzAllgemeine TextgenerierungOVH API-IntegrationRessourceneffizienter als größere Mistral

Schwächen

Weniger Tiefe als Mistral-Medium/LargeKontextgröße nicht dokumentiertBegrenzte Reasoning-Kapazität
Abschnitt 05

Fähigkeiten

ownedBy: mistralai
Abschnitt 06

Häufig gestellte Fragen

2506 ist Mistrals Versionierungssystem und deutet auf den Release-Zeitraum Mitte 2025 hin.

Als kompakter Ableger der Mistral-Familie findet Small 3.2 auf OVH seinen Platz zwischen Effizienz und Substanz.

Tokonomix-Benchmark-Zusammenfassung
Abschnitt 07

Tokonomix-Benchmark-Urteile

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-598/100 · 5 runs
5 correct0 partial0 wrong100% accuracy
2026-05-24

Baseline für Mistral Small 3.2 24B festgelegt

Dieses Urteil legt die anfängliche Performance-Baseline für Mistral Small 3.2 24B Instruct fest, bereitgestellt über OVH AI Endpoints in der GRA-Region. Als erste Bewertung liegen keine Vergleichsmetriken vor, um Veränderungen im Zeitverlauf zu evaluieren. Das Modell stellt Mistral AIs Small-Tier-Angebot innerhalb der 3.2-Generation dar und verfügt über 24 Milliarden Parameter mit Instruction-Tuning-Optimierungen. Nutzer sollten beachten, dass dieses Deployment regionsspezifisch auf die Rechenzentrums-Infrastruktur von OVH in Gravelines beschränkt ist, was die Latenzcharakteristik für unterschiedliche geografische Nutzergruppen beeinflussen kann. Zukünftige Urteile werden die Performance-Konsistenz, Schwankungen in der Antwortqualität sowie etwaige Verschiebungen bei den Capability-Metriken verfolgen. Die Parameterzahl von 24B positioniert dieses Modell als Mid-Range-Option, die potenziell Recheneffizienz und Fähigkeitsbreite ausbalanciert. Organisationen, die diesen Endpoint evaluieren, sollten eigene anwendungsspezifische Tests durchführen, um die Eignung für ihre Anwendungsfälle zu bestimmen, da initiale Baselines ohne Längsschnittdaten nur begrenzte Aussagekraft haben. Folgende Benchmark-Fenster werden zeigen, ob die Performance stabil bleibt oder unter unterschiedlichen Lastbedingungen und Abfragemustern Varianz aufweist.

Quality

Latency p50

Test runs

0

Basiskennzahlen festgelegt Regionale Bereitstellung bestätigt
Abschnitt 08

Vollständiges Modellprofil

mistral-small-3.2-24b-instruct-2506 — illustration 1
Mistral Small 3.2 24B Instruct auf OVH AI Endpoints

Mistral Small 3.2 ist die Juni-2025-Aktualisierung der 24-Milliarden-Parameter-Modellreihe Mistral Small. OVH AI Endpoints stellt das Modell von französischer Infrastruktur bereit. Für europäische Teams, die nach einem mittelschweren Modell suchen, das weder die Kosten eines Flaggschiffmodells erreicht noch in der Beschränkung kleiner Modelle gefangen ist, besetzt dieses eine interessante Zwischenposition.

Worum es sich handelt

Die „3.2"-Version ist eine optimierte Iteration gegenüber Mistral Small 3.1, das die Produktlinie bereits auf ein wettbewerbsfähiges Niveau im mittleren Segment für Reasoning und Instruktionsbefolgung gebracht hatte. Das Suffix 2506 ist der Release-Datumsstempel. Die Small-3.x-Reihe trägt die architektonischen Entscheidungen, die Mistral im Rahmen ihrer Arbeit der zweiten Generation getroffen hat, einschließlich Verbesserungen bei der Instruktionsbefolgung, der Zuverlässigkeit strukturierter Ausgaben und der Stabilität bei der Tool-Nutzung.

Was die Modalität betrifft, sollten Sie den OVH-Endpoint als Text-First behandeln, sofern Sie Vision nicht explizit gegen Ihren eigenen Workflow verifiziert haben. Mistrals 3.x-Reihe hat Varianten mit Vision-Fähigkeiten ausgeliefert, und die Situation hat sich über Punkt-Releases hinweg verschoben, sodass die sichere Standardannahme ist, Text-Input und Text-Output zu planen und Bild-Input erst zu testen, nachdem Sie das Verhalten gegen die spezifische Endpoint-Version bestätigt haben, die OVH derzeit betreibt.

Das Kontextfenster ist großzügig für diese Größenklasse. Tool-Calling und JSON-Output sind zuverlässig genug, um echte agentische Systeme darauf aufzubauen, mit dem üblichen Vorbehalt, dass jede produktive Nutzung strukturierter Ausgaben einen Validator dahinter benötigt.

Wo es glänzt

Mistral Small 3.2 trifft den Punkt, an dem Sie echtes Reasoning benötigen, ohne für ein Modell der 70B-Klasse zu zahlen. Aufgaben, die das Befolgen strukturierter Instruktionen, leichtes Reasoning und mehrsprachige Content-Generierung mischen, sind seine Stärke. Das Modell behält eine kohärente Stimme über längere Antworten hinweg bei und folgt stilistischen Vorgaben, ohne zu entgleisen.

Die mehrsprachige Leistung ist gut über die großen europäischen Sprachen hinweg, besonders im Französischen, wo sowohl Mistrals Trainingsdaten als auch Tokenizer-Entscheidungen einen Schwerpunkt setzen. Deutsch, Italienisch, Spanisch und Portugiesisch sind solide. Die Abdeckung kleinerer europäischer Sprachen ist brauchbar, aber variabel.

Code-Generierung ist kompetent in Mainstream-Sprachen. Function-Calling ist zuverlässig, mit stabilem JSON-Output und ordentlicher Multi-Tool-Orchestrierung. Für agentische Workflows, die ein Modell im mittleren Segment benötigen, ist dies eine der besseren Optionen im Preissegment.

Wo es Schwächen zeigt

Es ist kein Frontier-Modell. Die härtesten Reasoning-Benchmarks favorisieren weiterhin schwerere Closed-Weight-Modelle. Lange, mehrstufige Planung, die das Halten vieler Constraints im Blick erfordert, kann abdriften. Mathematik jenseits moderater Komplexität ist unzuverlässig. Code in ungewöhnlichen Sprachen oder mit subtilen Korrektheitsbedingungen sollte geprüft werden.

Die Ausführlichkeitstendenz, die sich durch die Mistral-Reihe zieht, ist vorhanden. Fordern Sie Prägnanz über den Prompt an, wenn Sie sie benötigen, und erzwingen Sie sie mit Token-Limits, falls nötig.

Für Vision-Workloads sollten Sie keine Fähigkeit ohne Verifikation annehmen. Wenn Ihr Anwendungsfall Bild-First ist, schauen Sie sich Endpoints an, die explizit dafür gebaut sind, wie etwa die Qwen-Vision-Language-Reihe im OVH-Katalog oder einen Anbieter mit dokumentierter Vision-API.

Die OVH- und EU-Position

OVH hostet die Inferenz von Gravelines oder Roubaix aus. Französische Infrastruktur, europäischer DPA, kein Training auf Kundenprompts. Für mittelschwere Workloads, bei denen das Beschaffungsgespräch Anforderungen an Datenresidenz einschließt, ist dies eine der glaubwürdigen Optionen. Der Katalog von Modellen der 24B-Klasse mit dieser Hosting-Geschichte ist schmaler als der Katalog kleiner Modelle.

Die OpenAI-kompatible API-Oberfläche hält die Integrationsreibung niedrig. Bestehende SDKs, Orchestrierungsbibliotheken und Agent-Frameworks lassen sich ohne Neuschreibungen einstecken.

Preisgestaltung

Aufgeführt auf der OVH-AI-Endpoints-Seite. Tarife im mittleren Segment. Wir veröffentlichen sie nicht erneut, weil sie sich ändern und wir es vorziehen, dass Sie die Quelle prüfen. Generell sitzt die 24B-Klasse komfortabel über den 7-12B-Modellen und deutlich unter der 70B-Klasse bei den Pro-Aufruf-Kosten.

Auswahl dieses Modells versus Alternativen

Wenn Sie echtes Mid-Tier-Reasoning mit EU-Residenz benötigen: setzen Sie dies auf die Shortlist. Wenn Ihr Traffic größtenteils in der Komfortzone eines kleineren Modells liegt: zahlen Sie die niedrigeren Pro-Aufruf-Kosten und nutzen Sie stattdessen Mistral 7B oder Llama 3.1 8B. Wenn Sie Top-Qualität benötigen und Spielraum im Budget haben: steigen Sie auf die 70B-Klasse auf. Wenn Vision im Scope ist: bestätigen Sie zuerst das Endpoint-Verhalten, oder wählen Sie ein Modell, dessen Vision-Support explizit ist.

Ein praktisches Muster: Small-Model-Default plus Mistral Small 3.2 bei Eskalation funktioniert gut für Support- und Content-Pipelines. Der Trennpunkt hängt von Ihren realen Prompts und Ihrer Toleranz für Fehlklassifikationen ab.

Vergleichen Sie auf denselben Prompts über das Leaderboard; siehe Methodology für das, was wir messen; mehrsprachige Aufschlüsselung unter /benchmarks/languages.

Fazit

Ein solides, instruktions-getuntes Modell der mittleren Leistungsklasse von Mistral, bereitgestellt auf französischer Infrastruktur, kürzlich genug aktualisiert, um wettbewerbsfähig zu bleiben. Mistral Small 3.2 ist eine der praktischeren Standardwahlen für europäische Teams, die echtes Reasoning, mehrsprachige Qualität und eine dokumentierte Residenz-Geschichte benötigen, ohne in die Heavyweight-Kategorie aufzusteigen.

Letzte technische Prüfung: 2026-05-22 — Tokonomix.ai

mistral-small-3.2-24b-instruct-2506 — illustration 2
Letzter automatisierter Test
27. Mai 2026 · 21:44 UTC · Geschwindigkeits-Benchmark
P50-Latenz
112 ms
P95-Latenz
129 ms
Fehler
0 / 6 Läufe
Zuletzt geprüft von Tokonomix-Team·26. Mai 2026