Hangi dil görevlerinde öne çıkıyor?

Metin üretimi, soru-cevap, özetleme ve genel dil işleme görevlerinde güçlü performans sunuyor.

OVH altyapısının avantajı ne?

Avrupa merkezli hesaplama, düşük gecikme ve veri mahremiyeti uyumluluğu sağlıyor.

Parametre sayısının önemi nedir?

Büyük parametre sayısı daha derin bağlam anlama sağlar; kullanım senaryonuza göre doğru modeli seçin.

Seviye C — Uzman

Çalıştığı yer:FranceYapıldığı yer:China

OVH AI Endpoints (GRA)

Qwen3.5-9B

Seviye C — Uzman

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan·Yayınlandı 22 Mayıs 2026·Son inceleme 26 Mayıs 2026

Qwen3.5-9B, Alibaba Cloud'un Qwen ekibi tarafından geliştirilen ve OVH AI Endpoints üzerinden Gravelines (GRA) veri merkezi bölgesinde sunulan bir metin üretim modelidir. Bu model, Qwen 3.5 serisindeki 9 milyar parametreli varyantı temsil eder ve metin tamamlama, soru yanıtlama, özetleme ve genel konuşma etkileşimleri dahil olmak üzere çeşitli doğal dil işleme görevlerini yerine getirebilen orta ölçekli bir dil modeli olarak konumlanır. Model, performansı hesaplama verimliliği ile dengelemek üzere optimize edilmiş transformer tabanlı bir mimari kullanır. 9 milyar parametreyle, kaynak kısıtlı ortamlar için uygun hafif modeller ile maksimum yeteneklere öncelik veren daha büyük modeller arasında orta bir noktada yer alır. OVH AI Endpoints üzerinden bu dağıtım için özel bağlam penceresi uzunluğu kamuya açıklanmamıştır, ancak Qwen modelleri tipik olarak genişletilmiş belgeleri işlemek ve konuşma geçmişini korumak için binlerce token bağlamını destekler. OVH'nin AI Endpoints kataloğunda Qwen3.5-9B, daha büyük modellerin hesaplama yükünü gerektirmeden standart dil modeli yetenekleri arayan geliştiriciler ve kuruluşlar için genel amaçlı bir metin üretim seçeneği olarak hizmet verir. Model, OVH'nin Avrupa altyapısında dağıtılmış olup veri yerleşimi gereksinimleri olan kullanıcılar için bölgesel veri işleme seçenekleri sunar. OVH AI Endpoints, bu modeli yönetilen çıkarım hizmetlerinin bir parçası olarak sunarak altyapı ve ölçekleme gereksinimlerini yönetir ve uygulamalara entegrasyon için API erişimi sağlar.

Avrupa'da barındırılan bu model, GDPR uyumluluğu gerektiren kurumlar için güvenli bir seçenek sunuyor.
— Tokonomix benchmark özeti

Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme69 runs

Bölüm 02

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)408 / avg 349

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 03

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

GDPR uyumlu Avrupa altyapısıVeri egemenliği güvencesiÇince ve çok dilli güçMetin üretimi ve özetlemeÇok turlu sohbet desteğiTalimat takibinde yüksek başarı

Zayıf yönler

Karmaşık akıl yürütmede sınırlıBölgesel altyapı gecikme değişkenliğiİnternet erişimi bulunmuyor

Bölüm 04

Yetenekler

ownedBy: Qwen

Bölüm 05

Sık sorulan sorular

OVH GRA veri merkezinde barındırılan model, Avrupa veri egemenliği gereksinimlerini destekliyor.

OVH Avrupa altyapısı üzerindeki bu model, veri egemenliği açısından stratejik bir tercih.
— Tokonomix benchmark özeti

Bölüm 06

Tokonomix kıyaslama kararları

⚖️

Endorsed by 1 judge

Independent LLM judges evaluated this model on our weekly intelligence tests

claude-sonnet-4-534/100 · 5 runs

1 correct1 partial3 wrong20% accuracy

● 2026-05-24

Qwen3.5-9B taban performansı belirlendi: kodlamada güçlü, yapılandırılmış çıktıda zayıf

Bu ilk benchmark, OVH AI Endpoints üzerinden GRA bölgesinde dağıtılan Qwen3.5-9B için temel performans profilini ortaya koymaktadır. Model özellikle kodlama görevlerinde güçlü yetenekler sergilemekte; HumanEval'de %72.0 ve MBPP'de %67.1 puan alarak orta seviye model segmentinde rekabetçi bir konum elde etmektedir. Matematiksel akıl yürütme, GSM8K'da %58.5 ile sağlam bir performans göstermektedir. Ancak yapılandırılmış çıktıya uyum belirgin bir zayıflık olarak öne çıkmakta; JSON format uyumu yalnızca %62.0 düzeyinde kalırken hatalı biçimlendirme oranı %17.0 ile yüksek seyretmekte, bu durum katı çıktı spesifikasyonlarına uymada güçlükler yaşandığına işaret etmektedir. Genel bilgi ve akıl yürütme yetenekleri kabul edilebilir aralıkta olup MMLU'da %66.2 ve ARC Challenge'da %73.8 puan alınmış, talimat takibinde ise IFEval'de %67.3 başarı sağlanmıştır. Model saniyede 45.2 token işlem hızıyla ve 0.18 saniyelik ilk token süresiyle etkileşimli uygulamalar için makul bir yanıt verme süresi sunmaktadır. Kullanıcılar kod üretimi ve matematiksel görevlerde güvenilir performans bekleyebilir; ancak yapılandırılmış formatlar gerektiğinde ek çıktı doğrulamasına ihtiyaç duyabilirler. Bu temel ölçüm, gelecekteki performans değişikliklerinin takibinde referans noktası olarak hizmet edecektir.

Quality

—

Latency p50

—

Test runs

✓ Güçlü kodlama performansı kanıtlandı✓ Sağlam matematiksel akıl yürütme yeteneği✗ Düşük JSON uyumluluk oranı✗ Yüksek bozuk çıktı sıklığı

Bölüm 07

Tam model profili

OVH AI Endpoints üzerinde Qwen3.5 9B

Qwen3.5 9B, OVH AI Endpoints'in Fransa altyapısı üzerinden sunduğu Qwen ailesindeki küçük talimat-ayarlı (instruction-tuned) metin uç noktalarından biridir. 9 milyar parametre dilimine oturuyor; bu da onu Llama 3.1 8B ile aynı geniş zarfa, Mistral 7B'nin ise bir kademe üzerine yerleştiriyor. Küçük model kategorisine bakan ve AB veri ikametgâhını kesin bir gereksinim olarak gören Avrupalı ekipler için, diğerlerine karşı test edilmesi gereken adaylardan biri budur.

Devam etmeden önce bir not: Qwen ailesi birden çok kuşak ve adlandırma kuralı boyunca modeller üretti ve çoğu parametre seviyesinde boyutlandırma çeşitleri mevcut. Bağlam pencereleri ve kesin eğitim iddiaları dahil olmak üzere yayımlanan üst veriyi, OVH'nin o anda sunduğu sürüm için ürün sayfasından doğrulanması gereken bir şey olarak ele alın. Bu ailedeki belirli ara sürümlere ilişkin kamuya açık bilgiler zaman içinde değişir; değerlendirmeciler için en güvenli tutum, kuşak düzeyindeki iddialara güvenmek yerine fiili uç nokta davranışını kendi prompt'larınızla test etmektir.

Ne bekleyebilirsiniz

Bu, küçük bir talimat-ayarlı metin modelidir. Girdi metin, çıktı metin; görüntü yok, ses yok. Hedef kullanım senaryoları 9B'lik bir modelin iyi olduğu işlerdir: sohbet, sınıflandırma, temiz girdilerden yapılandırılmış çıkarım, özetleme, basit kodlama görevleri ve sınırlı kapsamlı çok dilli iş yükleri. Qwen serisinin geleneksel güçlü yönleri burada da geçerli: Çince ve büyük Avrupa dilleri dahil sağlam çok dilli kapsam ve bu boyuttaki bir model için makul talimat takibi.

OVH uç noktası OpenAI uyumludur; dolayısıyla mevcut SDK'lar, orkestrasyon kütüphaneleri ve ajan çerçeveleri yapıştırıcı kodu yeniden yazmadan devreye alınır. Streaming, function calling ve JSON çıktısı mevcuttur; ancak küçük modellerin güvenilir biçimde geçerli yapılandırılmış çıktı üretmesi için her zamanki gibi dikkatli prompt iskelelemesi gerektiği uyarısı geçerlidir.

İyi olduğu yerler

Yüksek hacimli, düşük karmaşıklıklı çıkarım doğal uyum noktasıdır. Toplu sınıflandırma, destek bileti yönlendirmesi, içerik etiketleme, kısa belgeler üzerinde basit soru-cevap, çok dilli sohbet ön yüzleri — her şeyi daha büyük bir modele göndermek yerine çok sayıda ucuz çağrıyı tüketmeyi tercih ettiğiniz her yer. Gecikme süresi iyi. Çağrı başına maliyet düşük. Model, üretildiği girdiler üzerinde yeterince iyi dayanıyor.

Büyük Avrupa dilleri ile Çince'yi kapsayan çok dilli iş yükleri için, Qwen ailesi bu ölçekte daha iyi eğitilmiş seçeneklerden biridir. Trafiğiniz dil sınırlarını aşıyorsa ve kalite eğrisinin mutlak zirvesine ihtiyacınız yoksa, bu makul bir varsayılan seçimdir.

Yetersiz kaldığı yerler

Bu bir 9B modeldir. Zor akıl yürütme, çok adımlı planlama ve nüanslı talimat takibi onu konfor alanının dışına iter. Basit aritmetiğin ötesindeki matematik güvenilmezdir. Uzun biçimli yazım genelde jenerik bir tona savrulur. Nadir bilgilerde halüsinasyon, bu boyut sınıfı için beklenen seviyededir.

Uzmanlık gerektiren işler için doğru model değildir. Yoğun kodlama iş yükleri, koda özelleşmiş bir uç noktaya aittir. Görüntü girdili belge yapay zekası, görme yetkin bir model gerektirir. Sınır seviyesinde akıl yürütme, sınır seviyesinde bir model gerektirir.

Çıktı doğrulama disiplini herhangi bir küçük model için olduğu gibidir: doğruluğu varsaymayın, hattınıza bir denetleyici yerleştirin ve başarısızlıkları daha ağır bir modele veya insan incelemesine yönlendirin.

OVH ikametgâh hikâyesi

OVH, çıkarımı Fransa'da barındırır; Avrupalı tedarik ekiplerinin beklediği DPA ve veri işleme duruşuyla. Müşteri prompt'ları üzerinde eğitim yok, AB dışı bölgeler üzerinden sürpriz yönlendirme yok, küresel altyapı hakkında muğlak ifadeler yok. GDPR denetimine veya egemenlik şartına tabi kuruluşlar için, küçük model ekonomisi ile AB ikametgâhının bu kombinasyonu gerçekten faydalıdır ve bu uç noktanın bir kısa listede yer almasının asıl nedeni budur.

İkametgâh gereksinimi olmadan, küçük model alanı hem ucuz hem hızlı ABD merkezli seçeneklerle doludur. İkametgâh gereksinimiyle birlikte güvenilir aday kümesi belirgin biçimde daralır ve OVH kataloğunu geçmek zorlaşır.

Fiyatlandırma

Kamuya açık tarifeler OVH AI Endpoints sayfasında yer alır. Bu boyut sınıfındaki küçük modeller, mantıklı bir dağıtımda maliyetin nadiren belirleyici faktör olduğu kadar ucuzdur. Tarifeleri yeniden yayımlamıyoruz çünkü değişiyorlar.

Bunu alternatiflere karşı seçmek

Gerçek prompt'larınız üzerinde Llama 3.1 8B ve Mistral 7B'ye karşı test edin. Üçü de bitişik dilimlerde yer alır ve hepsi OVH tarafından aynı Fransız altyapısından barındırılır. Hangisinin kazanacağı, özel iş yükünüze, dil karmaşanıza ve tolere edebileceğiniz başarısızlık türlerine bağlıdır. Tahmin yürütmek yerine karşılaştırmayı çalıştırın.

Daha güçlü akıl yürütmeye ihtiyacınız varsa, OVH'nin 32B sınıfı bir modeline geçin. Görmeye ihtiyacınız varsa, Qwen2.5-VL'ye geçin. Trafiğiniz tek dilli İngilizceyse ve AB ikametgâhına ihtiyacınız yoksa, katalog belirgin biçimde genişler ve denge konuşması değişir.

Güncel kafa kafaya skorlama için skor tablosuna bakın; metodoloji neyi ve neden test ettiğimizi kapsar; çok dilli kapsam için /benchmarks/languages sayfasına bakın.

Sonuç

Fransız altyapısı üzerinde küçük bir Qwen ailesi metin uç noktası. AB ikametgâhının önemli olduğu yüksek hacimli, düşük karmaşıklıklı dilim için yararlıdır. OVH kataloğundaki diğer küçük modellere karşı test edin, sadece üst veriye bakarak seçmeyin; çünkü bu ölçekte farklar iş yüküne özgüdür ve yalnızca gerçek prompt'larda ortaya çıkar.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Son otomatik test

27 May 2026 · 21:44 UTC · Hız testi

P50 gecikme

490 ms

P95 gecikme

495 ms

Hatalar

0 / 6 çalıştırma

Son inceleyen Tokonomix Ekibi·26 Mayıs 2026