İçeriğe geç
Seviye C — Uzman
Çalıştığı yer:FranceYapıldığı yer:France
OVH AI Endpoints (GRA)

Mistral-Nemo-Instruct-2407

Seviye C — Uzman

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··

Mistral-Nemo-Instruct-2407, Mistral AI tarafından NVIDIA iş birliğiyle geliştirilen 12 milyar parametreli bir dil modelidir. Temmuz 2024'te yayımlanan model, 128k token bağlam penceresine sahip olup standart bir transformer mimarisi üzerine kuruludur. Talimat takibi görevleri için ince ayar yapılmış olan model; sohbet tabanlı yapay zeka, metin üretimi ve akıl yürütme yetenekleri gerektiren uygulamalar için uygundur. Bu model, kullanıcı talimatlarını doğru biçimde takip etmeye vurgu yapan genel amaçlı metin üretimi için tasarlanmıştır. Başta İngilizce olmak üzere Fransızca, Almanca, İspanyolca, İtalyanca, Portekizce, Çince, Japonca, Korece, Arapça ve Hintçe dillerinde güçlü çoklu dil desteği sunar. Model, denetimli ince ayar gibi teknikler kullanmakta olup performans ile hesaplama verimliliği arasında denge kuracak şekilde optimize edilmiştir; bu da çeşitli altyapı kurulumlarına dağıtımını kolaylaştırır. OVH AI Endpoints, Mistral-Nemo-Instruct-2407'yi yönetilen yapay zeka çıkarım hizmetinin bir parçası olarak GRA (Gravelines, Fransa) veri merkezi bölgesi üzerinden sunar. Bu dağıtım, kullanıcıların Mistral AI'ın talimatla ayarlanmış modeline özel altyapı yönetimine gerek kalmadan erişmesini sağlar. Model, OVH'nin geniş AI Endpoints portföyünde orta ölçekli bir seçenek olarak konumlanır; daha küçük modellere kıyasla daha güçlü akıl yürütme yetenekleri sunarken daha büyük amiral gemisi modellere göre daha düşük kaynak gereksinimi gerektirir. Özellikle kurumsal ve geliştirici iş akışlarında çoklu dil desteği ve genişletilmiş bağlam anlayışı gerektiren uygulamalar için uygundur.

Avrupa'da barındırılan bu model, GDPR uyumluluğu gerektiren kurumlar için güvenli bir seçenek sunuyor.

Tokonomix benchmark özeti
Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme69 runs
9118327636846005-1105-27ms
Bölüm 02

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — Mistral-Nemo-Instruct-2407
$0.2000 1M giriş token başına
$0.6000 1M çıkış token başına
≈ $0.0002 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$0.2000
1M çıkış token başına$0.6000

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.2000

input / 1M

— no change

$0.6000

output / 1M

— no change

2026-05-242026-05-242026-05-24
Input
Output
Price change
⟳ synced weekly
Bölüm 03

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)1869 / avg 1543
2157410

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 04

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

GDPR uyumlu Avrupa altyapısıVeri egemenliği güvencesiVerimli transformer mimarisi12 dil geniş çok dilli destekMetin üretimi ve özetlemeÇok turlu sohbet desteği

Zayıf yönler

Bölgesel altyapı gecikme değişkenliğiİnternet erişimi bulunmuyorGörsel işleme desteği yok
Bölüm 05

Yetenekler

ownedBy: mistralai
Bölüm 06

Sık sorulan sorular

OVH GRA veri merkezinde barındırılan model, Avrupa veri egemenliği gereksinimlerini destekliyor.

OVH Avrupa altyapısı üzerindeki bu model, veri egemenliği açısından stratejik bir tercih.

Tokonomix benchmark özeti
Bölüm 07

Tokonomix kıyaslama kararları

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-599/100 · 5 runs
5 correct0 partial0 wrong100% accuracy
2026-05-24

Mistral-Nemo-Instruct-2407, Güçlü Orta Segment Performansıyla Sahneye Çıkıyor

Mistral-Nemo-Instruct-2407, OVH AI Endpoints üzerinden GRA bölgesinde sunulan, yetkin bir orta segment model olarak kıyaslama sahnesine giriyor. Bu, gelecekteki karşılaştırmalar için performans metriklerini belirleyen ilk temel değerlendirmedir. Model; genel amaçlı dil görevleri, talimat takibi ve sohbet uygulamaları için uygun, rekabetçi yetenekler sergiliyor. Mistral'in Nemo sınıfı bir modeli olarak, performans ile verimlilik arasında bir denge kurarak amiral gemisi modellerin kaynak taleplerine ihtiyaç duymadan güvenilir dil anlama gerektiren kullanım senaryolarını hedefliyor. Kullanıcılar, bunun Gravelines'taki OVH altyapısı üzerinden bölgesel bir dağıtım olduğunu ve bu durumun farklı coğrafi konumlardaki gecikme süresi karakteristiklerini etkileyebileceğini göz önünde bulundurmalıdır. Instruction-tuned varyant, kullanıcı yönergelerini takip etme ve yapılandırılmış görevler için optimize edildiğine işaret ediyor. Karşılaştırma için geçmiş veri bulunmadığından, bu değerlendirme; ileride performans eğilimlerini, yetenek iyileşmelerini veya gerilemelerini izlemek için referans noktası işlevi görmektedir. Bu modeli değerlendiren kuruluşlar, üretim ortamına geçiş uygunluğunu ölçerken kendi gecikme süresi gereksinimlerini ve GRA bölgesine coğrafi yakınlıklarını dikkate almalıdır.

Quality

Latency p50

Test runs

0

Başlangıç temel çizgisi oluşturuldu Orta kademe performans seviyesi Talimatla ayarlanmış yetenekler
Bölüm 08

Tam model profili

mistral-nemo-instruct-2407 — illustration 1
OVH AI Endpoints üzerinde Mistral NeMo Instruct

Mistral NeMo Instruct, Mistral AI'nin NVIDIA ile işbirliği içinde geliştirdiği ve Temmuz 2024'te yayımladığı 12 milyar parametreli talimat-ayarlı modeldir. Model adındaki "2407" YYAA tarih damgasıdır. OVH AI Endpoints bu modeli Fransız altyapısından sunuyor; bu da onu AB merkezli katalogdaki orta-küçük boy seçenekler arasında dikkat çekici kılıyor.

NeMo'yu farklı kılan özellikler

İki şey. 128 bin token'lık bağlam penceresi, bu boyut sınıfındaki bir model için olağandışı derecede cömerttir. Ve tokenizer'ı Tekken, özellikle çok dilli verimlilik düşünülerek tasarlanmış olup, çoğu Avrupa dilinde Llama ailesi tokenizer'larından karakter başına daha az token üretiyor. İkinci nokta sessizce önemlidir: Fransızca, Almanca, İtalyanca ve İspanyolca iş yükleri için istek başına daha az token harcarsınız; bu da doğrudan daha düşük maliyete ve aynı prompt için daha uzun efektif bağlama dönüşür.

Model yalnızca metin tabanlıdır, giriş ve çıkışta. Görüntü yok, ses yok. Talimat-ayarlı varyant üretim çalışmaları için istediğiniz şeydir; temel model mevcut ancak öngörülebilir davranış için önemli ölçüde daha fazla prompt mühendisliği gerektirir.

Nerede iyi performans gösteriyor

Çok dilli sohbet en güçlü yönüdür. NeMo, önemli Avrupa dillerini eski Mistral 7B serisine göre belirgin şekilde daha az bozulmayla işler ve aynı dillerde Llama 3.1 8B ile iyi rekabet eder. Çok dilli destek iş akışları, Kıta Avrupa'sındaki müşteri odaklı chatbot'lar veya diller arası hareket eden içerik hatları için mantıklı bir varsayılandır.

Fonksiyon çağrısı, 12B'lik bir model için makul bir güvenilirlik seviyesinde çalışır. JSON çıktısı, promptta şemayı kısıtladığınızda güvenilirdir. 128 bin token'lık bağlam penceresi, uygulanabilir iş yüklerinin şeklini değiştirir: orta büyüklükte bir belgeyi, sohbet geçmişini ve bir talimatı bir arama katmanı geliştirmeden tek bir çağrıda ona verebilirsiniz.

Gecikme iyidir. Model, yanıtları hızla akışa almak için yeterince küçüktür; bu, kullanıcının imleci bekleyerek çıktıyı izlediği etkileşimli kullanım senaryoları için önemlidir.

Nerede yetersiz kalıyor

NeMo, yetkin bir orta-küçük modeldir, ağır siklet değildir. Zor mantık yürütme, karmaşık çok adımlı planlama ve ciddi kodlama işleri sınırlarını ortaya çıkaracaktır. Çıktı, aksi belirtilmedikçe ayrıntılı olmaya yöneliktir. Nadir varlıklarda varsanı oluşturma, boyut sınıfına uygun şekilde mevcuttur.

Kod üretimi ana dillerde işlevseldir ve daha az yaygın dillerde daha zayıftır. İş yükünüz kod ağırlıklıysa, bunun yerine kod odaklı bir modele bakın.

128 bin token'lık bağlam kesin bir sayıdır, esnek bir vaat değil. Pencerenin üst ucuna doğru ilerledikçe dikkat kalitesi bozulur; çoğu uzun bağlam modeli için olduğu gibi. Geri getirme kritik işler için, uygun bir RAG katmanı her şeyi naifçe bağlama tıkıştırmaktan daha iyi performans gösterir.

AB ve OVH açısı

OVH, NeMo'yu Gravelines veya Roubaix'den, Fransız topraklarında, Avrupa tedarik ekiplerinin bir DPA'dan beklediği şeyi yapan bir DPA ile çalıştırıyor. Müşteri promptları üzerinde eğitim yok, AB dışı bölgelere sürpriz çıkış yok, "küresel altyapı" hakkında kaçamak yok. GDPR incelemesi altında veya egemenlik yetkisi altında olan kuruluşlar için, bu kombinasyon bu endpoint'in var olmasının gerçek nedenidir.

Bu barındırma hikayesiyle güvenilir orta boy modellerin katalogu kısadır. Hiper ölçekli sağlayıcılar AB bölgeleri sunar ancak güven duruşu yapısal olarak farklıdır. OVH'nin sunumu daha dar ve doğrulanması daha kolaydır. Bunun önemli olup olmadığı tedariki kimin onayladığına bağlıdır.

Fiyatlandırma

OVH AI Endpoints sayfasında listelenir. Fiyatlar değişir; onları yeniden yayımlamayız. NeMo, uygun fiyatlı orta katmanda yer alır; 70B sınıfı modellerden daha ucuz, 7B sınıfından çağrı başına daha pahalıdır.

NeMo'yu alternatiflere karşı seçmek

Şu durumlarda NeMo'ya yönelin: 7-8B modelinin sunduğunun üzerinde çok dilli kalite istiyorsunuz, sınır katmanı fiyatları ödemeden uzun bağlam penceresi istiyorsunuz, AB ikamet hikayesini istiyorsunuz ve görüntüye ihtiyacınız yok. Trafiğiniz tek dilli İngilizce ise ve maliyet önemli olan tek eksen ise, daha küçük Mistral veya Llama 8B modelleri daha ucuz ve birçok iş yükü için yeterince iyidir. Daha güçlü mantık yürütmeye ihtiyacınız varsa, OVH kataloğundaki 70B sınıfı modeller bariz bir sonraki adımdır.

Toplu metin sınıflandırmasında saf verim-başına-euro için, 7B modelleri hala kazanacaktır. 128 bin token'lık pencereye sahip etkileşimli çok dilli sohbet için, NeMo, AB merkezli kategoride yenmesi zordur.

Güncel puanlama için intelligence sayfasına bakın; çok dilli kapsam /benchmarks/languages adresinde; model başına gecikme /benchmarks/speed adresinde bulunur.

Sonuç

Uzun bağlam penceresine sahip, Fransız altyapısında, mantıklı bir fiyat noktasında çok dilli dostu 12B model. NeMo, OVH kataloğundaki daha az değer verilen girişlerden biridir. Manşetlere çıkan model değildir. Birden fazla dilde destek, içerik veya çıkarma hatları oluşturan Avrupa ekipleri için, genellikle doğru pragmatik cevaptır.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

mistral-nemo-instruct-2407 — illustration 2mistral-nemo-instruct-2407 — illustration 3
Son otomatik test
27 May 2026 · 21:44 UTC · Hız testi
P50 gecikme
107 ms
P95 gecikme
133 ms
Hatalar
0 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·26 Mayıs 2026