İçeriğe geç
Seviye C — Uzman
Çalıştığı yer:FranceYapıldığı yer:France
OVH AI Endpoints (GRA)

Mistral-Small-3.2-24B-Instruct-2506

Seviye C — Uzman

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··

Mistral-Small-3.2-24B-Instruct-2506, Mistral AI tarafından geliştirilmiş ve OVH AI Endpoints aracılığıyla GRA (Gravelines) bölgesinde sunulan kompakt bir dil modelidir. Mistral'ın instruction-tuned model ailesinin bir parçası olarak, doğal dil talimatlarını takip etmek ve genel amaçlı metin üretim görevlerini yerine getirmek üzere tasarlanmıştır. 24 milyar parametre mimarisi, onu Mistral'ın portföyünde hafif bir seçenek olarak konumlandırır ve standart dil anlama ve üretim iş akışları için hesaplama verimliliği ile yetenek arasında bir denge sunar. Bu model, soru yanıtlama, özetleme, içerik üretimi ve temel akıl yürütme operasyonları gibi görevler için optimize edilmiştir. Instruction-tuning metodolojisi, kullanıcı promptlarını temel modellerden daha güvenilir bir şekilde yorumlamasını sağlar ve uzmanlaşmış alan bilgisinden ziyade doğrudan görev tamamlamanın öncelikli olduğu uygulamalar için uygun hale getirir. 2506 tanımlaması, Mistral'ın versiyon şemasındaki yayın zaman çizelgesini gösterir ve 2025 ortası itibarıyla güncel olan eğitim verisi ve hizalama prosedürlerine yapılan güncellemeleri yansıtır. OVH AI Endpoints ekosistemi içinde Mistral-Small-3.2-24B-Instruct-2506, daha büyük modellerin kaynak yükü olmadan standart dil modeli yeteneklerine ihtiyaç duyan geliştiriciler için erişilebilir bir giriş noktası görevi görür. OVH'nin Gravelines'daki altyapı konuşlandırması, gecikme süreleri ve veri yerleşim gereksinimleri açısından önemli olabilecek Avrupa tabanlı barındırma sağlar. Model, orta karmaşıklıkta dil görevlerinin yeterli olduğu uygulamalar için genel amaçlı bir araç işlevi görür ve ölçek ve uzmanlaşma açısından Mistral'ın orta ve büyük varyantlarının altında yer alır.

Avrupa'da barındırılan bu model, GDPR uyumluluğu gerektiren kurumlar için güvenli bir seçenek sunuyor.

Tokonomix benchmark özeti
Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme69 runs
63132325833843510305-1105-27ms
Bölüm 02

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — Mistral-Small-3.2-24B-Instruct-2506
$0.2000 1M giriş token başına
$0.6000 1M çıkış token başına
≈ $0.0002 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$0.2000
1M çıkış token başına$0.6000

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.2000

input / 1M

— no change

$0.6000

output / 1M

— no change

2026-05-242026-05-242026-05-24
Input
Output
Price change
⟳ synced weekly
Bölüm 03

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)1786 / avg 1923
309987

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 04

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

GDPR uyumlu Avrupa altyapısıVeri egemenliği güvencesiVerimli transformer mimarisiMetin üretimi ve özetlemeÇok turlu sohbet desteğiTalimat takibinde yüksek başarı

Zayıf yönler

Karmaşık akıl yürütmede sınırlıBölgesel altyapı gecikme değişkenliğiİnternet erişimi bulunmuyor
Bölüm 05

Yetenekler

ownedBy: mistralai
Bölüm 06

Sık sorulan sorular

OVH GRA veri merkezinde barındırılan model, Avrupa veri egemenliği gereksinimlerini destekliyor.

OVH Avrupa altyapısı üzerindeki bu model, veri egemenliği açısından stratejik bir tercih.

Tokonomix benchmark özeti
Bölüm 07

Tokonomix kıyaslama kararları

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-598/100 · 5 runs
5 correct0 partial0 wrong100% accuracy
2026-05-24

Mistral Small 3.2 24B için temel performans belirlendi

Bu karar, OVH AI Endpoints üzerinden GRA bölgesinde dağıtılan Mistral Small 3.2 24B Instruct için ilk performans referansını oluşturuyor. İlk değerlendirme olduğundan, zaman içindeki değişimleri ölçmek için karşılaştırmalı metrikler bulunmuyor. Model, Mistral AI'ın 3.2 nesil ürün gamındaki küçük segment teklifini temsil ediyor; 24 milyar parametre ve talimat ayarı optimizasyonları içeriyor. Kullanıcılar, bu dağıtımın OVH'nin Gravelines veri merkezi altyapısına özgü olduğunu ve farklı coğrafi kullanıcı tabanları için gecikme özelliklerini etkileyebileceğini göz önünde bulundurmalıdır. Sonraki kararlar; performans tutarlılığını, yanıt kalitesi değişimlerini ve yetenek metriklerindeki olası kaymaları takip edecek. 24B parametre sayısı, bu modeli orta segment bir seçenek olarak konumlandırıyor; hesaplama verimliliği ile yetenek kapsamı arasında bir denge kurma potansiyeli taşıyor. Bu uç noktayı değerlendiren kurumlar, ilk referansların uzunlamasına veri olmadan sınırlı içgörü sunması nedeniyle, kullanım senaryolarına uygunluğu belirlemek için uygulamaya özgü kendi testlerini yürütmelidir. Sonraki kıyaslama dönemleri, performansın istikrarlı kalıp kalmadığını veya farklı yük koşulları ve sorgu desenleri altında varyans gösterip göstermediğini ortaya koyacaktır.

Quality

Latency p50

Test runs

0

Temel ölçütler belirlendi Bölgesel dağıtım onaylandı
Bölüm 08

Tam model profili

mistral-small-3.2-24b-instruct-2506 — illustration 1
OVH AI Endpoints üzerinde Mistral Small 3.2 24B Instruct

Mistral Small 3.2, 24 milyar parametreli Mistral Small serisinin Haziran 2025 güncellemesidir. OVH AI Endpoints bu modeli Fransa altyapısı üzerinden sunuyor. Amiral gemisi maliyetine ulaşmayan, ancak küçük model zarfına da sıkışmayan orta-ağır sıklet bir modele bakan Avrupalı ekipler için bu, ilgi çekici bir orta konumda yer alıyor.

Nedir bu model

"3.2" sürümü, serinin zaten rekabetçi bir orta seviye muhakeme ve talimat takibi düzeyine taşınmasını sağlayan Mistral Small 3.1'in ince ayarlanmış bir iterasyonudur. 2506 son eki yayın tarihi damgasıdır. Small 3.x serisi, talimat takibi, yapılandırılmış çıktı güvenilirliği ve araç kullanım kararlılığında yapılan iyileştirmeler dahil olmak üzere Mistral'in ikinci nesil çalışmalarında benimsediği mimari seçimleri taşıyor.

Modaliteler açısından, OVH endpoint'ini görseli kendi iş akışınıza karşı açıkça doğrulamadığınız sürece metin öncelikli kabul edin. Mistral'in 3.x serisi görsel yetenekli varyantlar yayımladı ve durum sürüm güncellemeleri arasında değişti; bu nedenle güvenli varsayılan, metin girişi ve metin çıkışı planlamak ve görsel girişi yalnızca OVH'nin şu anda çalıştırdığı belirli endpoint sürümüne karşı davranışı doğruladıktan sonra test etmektir.

Bağlam penceresi bu boyut sınıfı için cömert. Araç çağırma ve JSON çıktısı, gerçek ajansal sistemler inşa edecek kadar güvenilir; her zamanki uyarıyla: yapılandırılmış çıktının her üretim kullanımının arkasında bir doğrulayıcıya ihtiyacı var.

Nerede iyi performans gösterir

Mistral Small 3.2, 70B sınıfı bir modelin bedelini ödemeden gerçek muhakemeye ihtiyaç duyduğunuz noktayı tam olarak vuruyor. Yapılandırılmış talimatları takip etme, hafif muhakeme ve çok dilli içerik üretiminin karıştığı görevler bu modelin en güçlü alanı. Model, daha uzun yanıtlar boyunca tutarlı bir ses tonu koruyor ve stil yönlendirmesini bozulmadan takip ediyor.

Çok dilli performans, başlıca Avrupa dilleri arasında iyi durumda; özellikle hem Mistral'in eğitim verisinin hem de tokenizer seçimlerinin yöneldiği Fransızca'da öne çıkıyor. Almanca, İtalyanca, İspanyolca ve Portekizce sağlam. Daha küçük Avrupa dillerinin kapsamı işlevsel ancak değişken.

Kod üretimi yaygın dillerde yetkin. Fonksiyon çağırma güvenilir; kararlı JSON çıktısı ve makul çoklu araç orkestrasyonu sunuyor. Orta katmanda bir modele ihtiyaç duyan ajansal iş akışları için bu, kendi fiyat noktasındaki en iyi seçeneklerden biri.

Nerede yetersiz kalır

Bu bir öncü model değil. En zor muhakeme kıyaslamaları hâlâ daha ağır kapalı ağırlıklı modelleri öne çıkarıyor. Birçok kısıtlamayı akılda tutmayı gerektiren uzun, çok adımlı planlamada sapma yaşanabilir. Orta karmaşıklığın ötesindeki matematik güvenilir değil. Sıra dışı dillerdeki veya ince doğruluk gerekliliklerine sahip kodların gözden geçirilmesi gerekir.

Mistral serisinde gözlemlenen ayrıntılı yanıt verme eğilimi burada da mevcut. Gerektiğinde özlülük için yönlendirme yapın ve gerekirse token sınırlarıyla zorunlu hale getirin.

Görsel iş yükleri için, doğrulama yapmadan yetenek olduğunu varsaymayın. Kullanım senaryonuz görsel öncelikliyse, OVH kataloğundaki Qwen görsel-dil serisi gibi bunun için açıkça inşa edilmiş endpoint'lere veya belgelenmiş bir görsel API'sine sahip bir sağlayıcıya bakın.

OVH ve AB konumu

OVH, çıkarımı Gravelines veya Roubaix'ten sağlıyor. Fransız altyapısı, Avrupa DPA'sı, müşteri istemleri üzerinde eğitim yapılmaması. Satın alma sürecinin veri ikamet gerekliliklerini içerdiği orta-ağır sıklet iş yükleri için bu, güvenilir seçeneklerden biri. Bu barındırma hikâyesine sahip 24B sınıfı modellerin kataloğu, küçük modellerin kataloğundan daha dar.

OpenAI uyumlu API arayüzü, entegrasyon sürtünmesini düşük tutuyor. Mevcut SDK'lar, orkestrasyon kütüphaneleri ve ajan çerçeveleri yeniden yazım gerektirmeden bağlanıyor.

Fiyatlandırma

OVH AI Endpoints sayfasında listeleniyor. Orta katman ücretleri. Fiyatlar değiştiği ve kaynağı kontrol etmenizi tercih ettiğimiz için bunları yeniden yayımlamıyoruz. Genel olarak 24B sınıfı, çağrı başına maliyette 7-12B modellerin rahatça üzerinde ve 70B sınıfının oldukça altında yer alıyor.

Bunu alternatiflere karşı seçmek

AB ikametiyle gerçek orta katman muhakemeye ihtiyacınız varsa: bunu kısa listenize alın. Trafiğinizin çoğu daha küçük bir modelin konfor bölgesindeyse: daha düşük çağrı başına maliyeti ödeyin ve onun yerine Mistral 7B veya Llama 3.1 8B kullanın. En üst düzey kaliteye ihtiyacınız varsa ve bütçenizde alan varsa: 70B sınıfına yükselin. Görsel kapsamdaysa: önce endpoint davranışını doğrulayın veya görsel desteği açık olan bir model seçin.

Pratik bir desen: küçük model varsayılanı artı yükseltmede Mistral Small 3.2, destek ve içerik hatları için iyi çalışıyor. Bölme noktası, gerçek istemlerinize ve yanlış sınıflandırmaya toleransınıza bağlıdır.

Aynı istemler üzerinde liderlik tablosu üzerinden karşılaştırın; neyi ölçtüğümüz için metodoloji sayfasına bakın; çok dilli ayrıntılar için /benchmarks/languages.

Sonuç

Mistral'den gelen sağlam, orta katman talimat ayarlı bir model; Fransız altyapısında sunuluyor ve rekabetçi kalacak kadar yakın zamanda güncellendi. Mistral Small 3.2, ağır sıklet katmana yükselmeden gerçek muhakemeye, çok dilli kaliteye ve belgelenmiş bir ikamet hikâyesine ihtiyaç duyan Avrupalı ekipler için en pratik varsayılanlardan biridir.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

mistral-small-3.2-24b-instruct-2506 — illustration 2
Son otomatik test
27 May 2026 · 21:44 UTC · Hız testi
P50 gecikme
112 ms
P95 gecikme
129 ms
Hatalar
0 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·26 Mayıs 2026