Hangi dil görevlerinde öne çıkıyor?

Metin üretimi, soru-cevap, özetleme ve genel dil işleme görevlerinde güçlü performans sunuyor.

OVH altyapısının avantajı ne?

Avrupa merkezli hesaplama, düşük gecikme ve veri mahremiyeti uyumluluğu sağlıyor.

Parametre sayısının önemi nedir?

Büyük parametre sayısı daha derin bağlam anlama sağlar; kullanım senaryonuza göre doğru modeli seçin.

Seviye C — Uzman

Çalıştığı yer:FranceYapıldığı yer:France

OVH AI Endpoints (GRA)

Mistral-Nemo-Instruct-2407

Seviye C — Uzman

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan·Yayınlandı 22 Mayıs 2026·Son inceleme 26 Mayıs 2026

Mistral-Nemo-Instruct-2407, Mistral AI tarafından NVIDIA iş birliğiyle geliştirilen 12 milyar parametreli bir dil modelidir. Temmuz 2024'te yayımlanan model, 128k token bağlam penceresine sahip olup standart bir transformer mimarisi üzerine kuruludur. Talimat takibi görevleri için ince ayar yapılmış olan model; sohbet tabanlı yapay zeka, metin üretimi ve akıl yürütme yetenekleri gerektiren uygulamalar için uygundur. Bu model, kullanıcı talimatlarını doğru biçimde takip etmeye vurgu yapan genel amaçlı metin üretimi için tasarlanmıştır. Başta İngilizce olmak üzere Fransızca, Almanca, İspanyolca, İtalyanca, Portekizce, Çince, Japonca, Korece, Arapça ve Hintçe dillerinde güçlü çoklu dil desteği sunar. Model, denetimli ince ayar gibi teknikler kullanmakta olup performans ile hesaplama verimliliği arasında denge kuracak şekilde optimize edilmiştir; bu da çeşitli altyapı kurulumlarına dağıtımını kolaylaştırır. OVH AI Endpoints, Mistral-Nemo-Instruct-2407'yi yönetilen yapay zeka çıkarım hizmetinin bir parçası olarak GRA (Gravelines, Fransa) veri merkezi bölgesi üzerinden sunar. Bu dağıtım, kullanıcıların Mistral AI'ın talimatla ayarlanmış modeline özel altyapı yönetimine gerek kalmadan erişmesini sağlar. Model, OVH'nin geniş AI Endpoints portföyünde orta ölçekli bir seçenek olarak konumlanır; daha küçük modellere kıyasla daha güçlü akıl yürütme yetenekleri sunarken daha büyük amiral gemisi modellere göre daha düşük kaynak gereksinimi gerektirir. Özellikle kurumsal ve geliştirici iş akışlarında çoklu dil desteği ve genişletilmiş bağlam anlayışı gerektiren uygulamalar için uygundur.

Mistral-Nemo-Instruct-2407 ile kendi sorularını test et

Avrupa'da barındırılan bu model, GDPR uyumluluğu gerektiren kurumlar için güvenli bir seçenek sunuyor.
— Tokonomix benchmark özeti

Bölüm 01

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰

API tarifeleri — Mistral-Nemo-Instruct-2407

$0.2000 1M giriş token başına

$0.6000 1M çıkış token başına

≈ $0.0002 tipik konuşma başına (800 token)

Giriş vs çıkış fiyatı (1M token başına)

1M giriş token başına$0.2000

1M çıkış token başına$0.6000

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.2000

input / 1M

— no change

$0.6000

output / 1M

— no change

2026-05-242026-05-242026-05-24

Input

Output

Price change

⟳ synced weekly

Bölüm 02

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

GDPR uyumlu Avrupa altyapısıVeri egemenliği güvencesiVerimli transformer mimarisi12 dil geniş çok dilli destekMetin üretimi ve özetlemeÇok turlu sohbet desteği

Zayıf yönler

Bölgesel altyapı gecikme değişkenliğiİnternet erişimi bulunmuyorGörsel işleme desteği yok

Bölüm 03

Yetenekler

ownedBy: mistralai

Bölüm 04

Sık sorulan sorular

OVH GRA veri merkezinde barındırılan model, Avrupa veri egemenliği gereksinimlerini destekliyor.

OVH Avrupa altyapısı üzerindeki bu model, veri egemenliği açısından stratejik bir tercih.
— Tokonomix benchmark özeti

Bölüm 05

Kullanılabilirlik

Henüz ölçüm verisi yok

Bu model için kullanılabilirlik istatistiklerini göstermek için yeterli API çağrısı henüz kaydedilmedi. Veri, model canlı trafik almaya başlayınca görünür.

Bölüm 06

Tokonomix kıyaslama kararları

⚖️

Endorsed by 1 judge

Independent LLM judges evaluated this model on our weekly intelligence tests

claude-sonnet-4-599/100 · 5 runs

5 correct0 partial0 wrong100% accuracy

● 2026-05-24

Mistral-Nemo-Instruct-2407, Güçlü Orta Segment Performansıyla Sahneye Çıkıyor

Mistral-Nemo-Instruct-2407, OVH AI Endpoints üzerinden GRA bölgesinde sunulan, yetkin bir orta segment model olarak kıyaslama sahnesine giriyor. Bu, gelecekteki karşılaştırmalar için performans metriklerini belirleyen ilk temel değerlendirmedir. Model; genel amaçlı dil görevleri, talimat takibi ve sohbet uygulamaları için uygun, rekabetçi yetenekler sergiliyor. Mistral'in Nemo sınıfı bir modeli olarak, performans ile verimlilik arasında bir denge kurarak amiral gemisi modellerin kaynak taleplerine ihtiyaç duymadan güvenilir dil anlama gerektiren kullanım senaryolarını hedefliyor. Kullanıcılar, bunun Gravelines'taki OVH altyapısı üzerinden bölgesel bir dağıtım olduğunu ve bu durumun farklı coğrafi konumlardaki gecikme süresi karakteristiklerini etkileyebileceğini göz önünde bulundurmalıdır. Instruction-tuned varyant, kullanıcı yönergelerini takip etme ve yapılandırılmış görevler için optimize edildiğine işaret ediyor. Karşılaştırma için geçmiş veri bulunmadığından, bu değerlendirme; ileride performans eğilimlerini, yetenek iyileşmelerini veya gerilemelerini izlemek için referans noktası işlevi görmektedir. Bu modeli değerlendiren kuruluşlar, üretim ortamına geçiş uygunluğunu ölçerken kendi gecikme süresi gereksinimlerini ve GRA bölgesine coğrafi yakınlıklarını dikkate almalıdır.

Quality

—

Latency p50

—

Test runs

✓ Başlangıç temel çizgisi oluşturuldu✓ Orta kademe performans seviyesi✓ Talimatla ayarlanmış yetenekler

Bölüm 07

Tam model profili

OVH AI Endpoints üzerinde Mistral NeMo Instruct

Mistral NeMo Instruct, Mistral AI'nin NVIDIA ile işbirliği içinde geliştirdiği ve Temmuz 2024'te yayımladığı 12 milyar parametreli talimat-ayarlı modeldir. Model adındaki "2407" YYAA tarih damgasıdır. OVH AI Endpoints bu modeli Fransız altyapısından sunuyor; bu da onu AB merkezli katalogdaki orta-küçük boy seçenekler arasında dikkat çekici kılıyor.

NeMo'yu farklı kılan özellikler

İki şey. 128 bin token'lık bağlam penceresi, bu boyut sınıfındaki bir model için olağandışı derecede cömerttir. Ve tokenizer'ı Tekken, özellikle çok dilli verimlilik düşünülerek tasarlanmış olup, çoğu Avrupa dilinde Llama ailesi tokenizer'larından karakter başına daha az token üretiyor. İkinci nokta sessizce önemlidir: Fransızca, Almanca, İtalyanca ve İspanyolca iş yükleri için istek başına daha az token harcarsınız; bu da doğrudan daha düşük maliyete ve aynı prompt için daha uzun efektif bağlama dönüşür.

Model yalnızca metin tabanlıdır, giriş ve çıkışta. Görüntü yok, ses yok. Talimat-ayarlı varyant üretim çalışmaları için istediğiniz şeydir; temel model mevcut ancak öngörülebilir davranış için önemli ölçüde daha fazla prompt mühendisliği gerektirir.

Nerede iyi performans gösteriyor

Çok dilli sohbet en güçlü yönüdür. NeMo, önemli Avrupa dillerini eski Mistral 7B serisine göre belirgin şekilde daha az bozulmayla işler ve aynı dillerde Llama 3.1 8B ile iyi rekabet eder. Çok dilli destek iş akışları, Kıta Avrupa'sındaki müşteri odaklı chatbot'lar veya diller arası hareket eden içerik hatları için mantıklı bir varsayılandır.

Fonksiyon çağrısı, 12B'lik bir model için makul bir güvenilirlik seviyesinde çalışır. JSON çıktısı, promptta şemayı kısıtladığınızda güvenilirdir. 128 bin token'lık bağlam penceresi, uygulanabilir iş yüklerinin şeklini değiştirir: orta büyüklükte bir belgeyi, sohbet geçmişini ve bir talimatı bir arama katmanı geliştirmeden tek bir çağrıda ona verebilirsiniz.

Gecikme iyidir. Model, yanıtları hızla akışa almak için yeterince küçüktür; bu, kullanıcının imleci bekleyerek çıktıyı izlediği etkileşimli kullanım senaryoları için önemlidir.

Nerede yetersiz kalıyor

NeMo, yetkin bir orta-küçük modeldir, ağır siklet değildir. Zor mantık yürütme, karmaşık çok adımlı planlama ve ciddi kodlama işleri sınırlarını ortaya çıkaracaktır. Çıktı, aksi belirtilmedikçe ayrıntılı olmaya yöneliktir. Nadir varlıklarda varsanı oluşturma, boyut sınıfına uygun şekilde mevcuttur.

Kod üretimi ana dillerde işlevseldir ve daha az yaygın dillerde daha zayıftır. İş yükünüz kod ağırlıklıysa, bunun yerine kod odaklı bir modele bakın.

128 bin token'lık bağlam kesin bir sayıdır, esnek bir vaat değil. Pencerenin üst ucuna doğru ilerledikçe dikkat kalitesi bozulur; çoğu uzun bağlam modeli için olduğu gibi. Geri getirme kritik işler için, uygun bir RAG katmanı her şeyi naifçe bağlama tıkıştırmaktan daha iyi performans gösterir.

AB ve OVH açısı

OVH, NeMo'yu Gravelines veya Roubaix'den, Fransız topraklarında, Avrupa tedarik ekiplerinin bir DPA'dan beklediği şeyi yapan bir DPA ile çalıştırıyor. Müşteri promptları üzerinde eğitim yok, AB dışı bölgelere sürpriz çıkış yok, "küresel altyapı" hakkında kaçamak yok. GDPR incelemesi altında veya egemenlik yetkisi altında olan kuruluşlar için, bu kombinasyon bu endpoint'in var olmasının gerçek nedenidir.

Bu barındırma hikayesiyle güvenilir orta boy modellerin katalogu kısadır. Hiper ölçekli sağlayıcılar AB bölgeleri sunar ancak güven duruşu yapısal olarak farklıdır. OVH'nin sunumu daha dar ve doğrulanması daha kolaydır. Bunun önemli olup olmadığı tedariki kimin onayladığına bağlıdır.

Fiyatlandırma

OVH AI Endpoints sayfasında listelenir. Fiyatlar değişir; onları yeniden yayımlamayız. NeMo, uygun fiyatlı orta katmanda yer alır; 70B sınıfı modellerden daha ucuz, 7B sınıfından çağrı başına daha pahalıdır.

NeMo'yu alternatiflere karşı seçmek

Şu durumlarda NeMo'ya yönelin: 7-8B modelinin sunduğunun üzerinde çok dilli kalite istiyorsunuz, sınır katmanı fiyatları ödemeden uzun bağlam penceresi istiyorsunuz, AB ikamet hikayesini istiyorsunuz ve görüntüye ihtiyacınız yok. Trafiğiniz tek dilli İngilizce ise ve maliyet önemli olan tek eksen ise, daha küçük Mistral veya Llama 8B modelleri daha ucuz ve birçok iş yükü için yeterince iyidir. Daha güçlü mantık yürütmeye ihtiyacınız varsa, OVH kataloğundaki 70B sınıfı modeller bariz bir sonraki adımdır.

Toplu metin sınıflandırmasında saf verim-başına-euro için, 7B modelleri hala kazanacaktır. 128 bin token'lık pencereye sahip etkileşimli çok dilli sohbet için, NeMo, AB merkezli kategoride yenmesi zordur.

Güncel puanlama için intelligence sayfasına bakın; çok dilli kapsam /benchmarks/languages adresinde; model başına gecikme /benchmarks/speed adresinde bulunur.

Sonuç

Uzun bağlam penceresine sahip, Fransız altyapısında, mantıklı bir fiyat noktasında çok dilli dostu 12B model. NeMo, OVH kataloğundaki daha az değer verilen girişlerden biridir. Manşetlere çıkan model değildir. Birden fazla dilde destek, içerik veya çıkarma hatları oluşturan Avrupa ekipleri için, genellikle doğru pragmatik cevaptır.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Son otomatik test

27 May 2026 · 21:44 UTC · Hız testi

P50 gecikme

107 ms

P95 gecikme

133 ms

Hatalar

0 / 6 çalıştırma

Son inceleyen Tokonomix Ekibi·26 Mayıs 2026