İçeriğe geç
Seviye C — Uzman
Çalıştığı yer:FranceYapıldığı yer:China
OVH AI Endpoints (GRA)

Qwen3-32B

Seviye C — Uzman

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··

Qwen3-32B, Alibaba Cloud'un Qwen ekibi tarafından geliştirilen, 32 milyar parametreye sahip büyük bir dil modelidir. Bu model, Qwen3 serisinde verimlilik için optimize edilmiş daha küçük varyantlar ile maksimum kapasite için tasarlanmış daha büyük modeller arasında konumlanan orta seviye seçeneği temsil eder. Yalnızca kod çözücülü transformer mimarisi üzerine inşa edilmiş olup çeşitli çok dilli veriler üzerinde eğitilmiştir; özellikle İngilizce ve Çince dil görevlerinde güçlü bir performans sergilemektedir. Model; içerik üretimi, soru yanıtlama, kod üretimi ve konuşma tabanlı yapay zekâ dahil olmak üzere genel amaçlı metin üretimi uygulamaları için tasarlanmıştır. Qwen3-32B, hesaplama verimliliği ile performansı dengeler; bu da onu kaynak kısıtlamalarının göz önünde bulundurulduğu ancak güçlü dil anlama yeteneğinin hâlâ gerekli olduğu üretim ortamları için uygun kılar. Model, standart doğal dil işleme kıyaslamalarında yetkinlik gösterir; ancak belirli performans metrikleri görev türüne göre değişkenlik gösterir. OVH AI Endpoints, Qwen3-32B'ye GRA (Gravelines, Fransa) veri merkezi bölgesi üzerinden erişim sunarak bu modeli yönetilen çıkarım hizmetinin bir parçası olarak sağlar. Bu entegrasyon, geliştiricilerin altyapıyı yönetmek zorunda kalmadan modele standart API çağrıları aracılığıyla erişmesine olanak tanır. Bu dağıtım için kesin bağlam penceresi belirtimi kamuya açık şekilde belgelenmemiş olsa da Qwen3 modelleri tipik olarak belge işleme ve çok turlu konuşmalar için uygun genişletilmiş bağlam uzunluklarını destekler. Bu dağıtım seçeneği, öngörülebilir gecikme süresi özelliklerine sahip GDPR uyumlu yapay zekâ altyapısı arayan Avrupalı kullanıcılar için uygundur.

Avrupa'da barındırılan bu model, GDPR uyumluluğu gerektiren kurumlar için güvenli bir seçenek sunuyor.

Tokonomix benchmark özeti
Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme69 runs
360814515930237153150005-1105-27ms
Bölüm 02

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — Qwen3-32B
$0.1500 1M giriş token başına
$0.4500 1M çıkış token başına
≈ $0.0002 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$0.1500
1M çıkış token başına$0.4500

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.1500

input / 1M

— no change

$0.4500

output / 1M

— no change

2026-05-242026-05-242026-05-24
Input
Output
Price change
⟳ synced weekly
Bölüm 03

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)485 / avg 393
55083

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 04

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

GDPR uyumlu Avrupa altyapısıVeri egemenliği güvencesiÇince ve çok dilli güçMetin üretimi ve özetlemeÇok turlu sohbet desteğiTalimat takibinde yüksek başarı

Zayıf yönler

Bölgesel altyapı gecikme değişkenliğiİnternet erişimi bulunmuyorGörsel işleme desteği yok
Bölüm 05

Yetenekler

ownedBy: Qwen
Bölüm 06

Sık sorulan sorular

OVH GRA veri merkezinde barındırılan model, Avrupa veri egemenliği gereksinimlerini destekliyor.

OVH Avrupa altyapısı üzerindeki bu model, veri egemenliği açısından stratejik bir tercih.

Tokonomix benchmark özeti
Bölüm 07

Tokonomix kıyaslama kararları

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-590/100 · 5 runs
4 correct1 partial0 wrong80% accuracy
2026-05-24

Qwen3-32B güçlü performans ve hızlı yanıt süreleriyle sahneye çıkıyor

Qwen3-32B, kıyaslama paketimizde OVH AI Endpoints aracılığıyla ilk kez yer alıyor ve tüm temel değerlendirme kategorilerinde sağlam bir referans noktası oluşturuyor. Model, özellikle matematiksel akıl yürütmede güçlü bir performans sergiliyor: MATH500'de 74.5, GSM8K'de 82.5 puan alarak kendi sınıfındaki modeller arasında rekabetçi bir konuma yerleşiyor. Yaratıcı yazım yetenekleri Creative Writing Hard'da 72.0 ile dengeli bir görünüm sunarken, talimat takibi IFEval'de 78.3'e ulaşıyor. Kod üretim performansı MultiPL-E'de 66.0 ile makul seviyede olup genel programlama görevleri için uygun. Model, MGSM'de 70.2 puanla tutarlı çok dilli destek sergiliyor ve MT-Bench'te 6.8 puanla çok turlu diyalogları yeterli düzeyde yönetiyor. Yanıt süreleri dikkat çekici biçimde hızlı: ilk token süresi ortalama 1.2 saniye, çıktı hızı saniyede 85.3 token düzeyinde sabit ve token'lar arası gecikme 11.7 ms. İlk değerlendirme olarak Qwen3-32B; akıl yürütme, yaratıcılık ve kodlama görevlerinde dengeli yeteneklere sahip, çok yönlü bir model olarak öne çıkıyor ve güvenilir performans göstergeleriyle farklı uygulama ihtiyaçlarını etkili biçimde karşılayabilecek bir profil sunuyor.

Quality

Latency p50

Test runs

0

Güçlü matematik akıl yürütme performansı Genel olarak hızlı yanıt süreleri Dengeli çok dilli destek Tutarlı verimlilik (throughput) metrikleri
Bölüm 08

Tam model profili

qwen3-32b — illustration 1
OVH AI Endpoints Üzerinde Qwen3 32B

Qwen3 32B, Alibaba'nın Qwen3 nesli içinden çıkan 32 milyar parametreli talimat eğitimli modelidir ve OVH AI Endpoints tarafından Fransız altyapısından sunulmaktadır. Genel amaçlı akıl yürütme, kodlama ve çok dilli sohbet için tasarlanmış orta ağırlık sınıfı bir metin modelidir ve OVH kataloğunda, sınır seviyesi ücretler ödemeden gerçek kalite isteyen Avrupalı ekipler için kullanışlı bir noktaya oturmaktadır.

Sıralamadaki konumu

Qwen3 sürümü, uç ortamlara uygun kompakt modellerden başlayıp amiral gemisi MoE varyantlarına kadar birden fazla boyutta kullanıma sunulmuştur. 32B yoğun model, daha küçük modellerin masa üzerinde çok fazla kalite bıraktığı ve çok büyük modellerin görevin gerektirdiğinden fazla maliyete sahip olduğu üretim işleri için ideal noktadır. Metin girip, metin çıkar. Görüntü yok, ses yok. İş akışınızın görüntü girdisi gerektirmesi durumunda, bunun yerine Qwen2.5-VL uç noktasına bakın.

Talimat eğitimli varyant, üretim için istediğiniz versiyondur. Temel modelin talep ettiği prompt mühendisliği yükü olmadan sohbet, yapılandırılmış çıktı, fonksiyon çağırma ve daha uzun biçimli üretimi yönetir.

Neyi iyi yapar

Çok adımlı problemler üzerinde akıl yürütme, önceki Qwen nesillerine göre en görünür gelişmedir. Qwen3, düşünce zinciri tarzı çıktılara kasıtlı odaklanarak eğitilmiştir ve 32B varyant, bu eğitimi gerçekten kullanmak için yeterli kapasiteye sahiptir. Birkaç kısıtlamayı takip etmeyi, bir soruyu parçalara ayırmayı veya savunulabilir bir yanıt üretmeyi gerektiren görevler için, bu model aynı ölçekteki diğer açık ağırlıklı seçeneklere karşı kendi başına ayakta durur.

Kodlama performansı ana akım dillerde iyidir. Model deyimsel kod yazar, prompt'ta sağlandığında API belgelerini takip eder ve istendiğinde test farkında çıktı üretir. Ajantik kodlama iş akışları için ağır işlerde kod odaklı bir model ve planlama ve incelemede Qwen3 32B gibi bir genelci isteyeceksiniz.

Çok dilli kullanım geniştir ve büyük Avrupa dilleri boyunca makul ölçüde dengeli, Qwen serisinin Çince'deki geleneksel gücüyle birlikte. Avrupa ve Asya dilleri arasında hareket eden iş yükleri için, eğitim verilerinin genişliği Qwen ailesinin gerçek avantajlarından biridir.

Araç çağırma ve JSON modu çıktısı, gerçek üretim ajentlerini çalıştırmak için yeterince güvenilirdir. OVH üzerindeki OpenAI uyumlu API yüzeyi, mevcut SDK'ların değişiklik olmadan çalışması anlamına gelir.

Nerede yetersiz kalır

Sınır seviyesi bir model değildir. En zor akıl yürütme kıyaslamalarında, en ağır kapalı ağırlıklı modeller hâlâ öne geçer. Boşluk rutin işler için kapanır ve sınır durumlar için genişler.

Uzun biçimli yazma ayrıntılı olmaya eğilimlidir. İhtiyacınız olduğunda açıkça kısa ve öz olmak için prompt yapın. Model ayrıca basit sorular sorulduğunda aşırı açıklama yapma eğilimindedir, bu da iş akışına bağlı olarak bazen kullanışlı bazen rahatsız edicidir.

Uzman alanlarda, çıktı kalitesi dengesizdir. Hukuk tarzı yazma, ağır prompt iskeleten faydalanır. Tıbbi akıl yürütme doğrulama gerektirir ve modelden bağımsız olarak alan uzmanı gözetimi olmadan konuşlandırılmamalıdır. Niş programlama dilleri, popüler olanlara göre daha zayıf sonuçlar alır.

AB yerleşik olma açısı

OVH, Qwen3 32B'yi Gravelines veya Roubaix'te çalıştırır. Çıkarım yolu uçtan uca Avrupa altyapısı içinde kalır, DPA Avrupalı tedarik ekiplerinin beklediği türdendir ve müşteri prompt'ları model eğitimi için kullanılmaz. GDPR denetimine, egemenlik yetkisine veya sektörel veri koruma kurallarına tabi kuruluşlar için, bu model yeteneği ve barındırma hikayesi kombinasyonu 32B sınıfındaki en temiz seçeneklerden biridir.

AB yerleşik olma ile güvenilir 32B sınıfı modellerin katalogu kısadır. Hiper ölçeklendiriciler AB bölgeleri sunar, ancak güven duruşu yapısal olarak Avrupa topraklarında çalışan bir Avrupa bulut sağlayıcısından farklıdır.

Fiyatlandırma

Kamu oranları OVH AI Endpoints sayfasındadır. Bunları yeniden yayınlamıyoruz çünkü haber vermeden güncelleniyor. Orta seviye çağrı başı maliyet, 7-12B küçük modellerin rahatça üzerinde ve 70B sınıfı ağır sikletlerin oldukça altında oturuyor.

Qwen3 32B'nin alternatiflere karşı seçimi

Sağlam orta seviye akıl yürütmeye, geniş çok dilli kapsama ve AB yerleşikliğine ihtiyacınız olduğunda ve görüntüye ihtiyacınız olmadığında buna uzanın. İşiniz rahatça daha küçük bir modelin zarfına sığıyorsa, 7-8B seçenekleri daha ucuz ve yeterince iyidir. Kalite eğrisinin mutlak zirvesine ihtiyacınız varsa, OVH kataloğundaki 70B sınıfı modeller anlamlı derecede yüksek çağrı başı maliyetle bir sonraki bariz adımdır.

Pratik bir model: kolay trafiği küçük bir modele yönlendirin, zor trafiği Qwen3 32B'ye yükseltin, gerçekten zor durumlar için bir 70B uç noktası ayırın. Bu kademeli yönlendirmenin ekonomisi, yönlendiricinin dikkatle kurulması ve yanlış sınıflandırma oranının varsayılmak yerine ölçülmesi koşuluyla pratikte iyi çalışır.

Alternatiflere karşı güncel puanlama için intelligence'a; birebir karşılaştırmalar için leaderboard'a; çok dilli dökümü için /benchmarks/languages'a; AB bölgelerindeki gecikme ölçümleri için /benchmarks/speed'e bakın.

Sonuç

Fransız altyapısında barındırılan Qwen3 neslinden yetenekli bir orta ağırlık metin modeli. Qwen3 32B, bir amiral gemisi modelinin maliyeti olmadan gerçek akıl yürütme kalitesine ihtiyaç duyan ve yerleşiklik hikayesinin tedarik incelemesine dayanması gereken Avrupalı ekipler için makul bir varsayılandır.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

qwen3-32b — illustration 2
Son otomatik test
27 May 2026 · 21:44 UTC · Hız testi
P50 gecikme
412 ms
P95 gecikme
439 ms
Hatalar
0 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·26 Mayıs 2026