Seviye A — Öncü

Çalıştığı yer:FranceYapıldığı yer:China

Qwen3.5-397B-A17B

Seviye A — Öncü

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan·Yayınlandı 27 Mayıs 2026·Son inceleme 25 Temmuz 2026

Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme105 runs

Bölüm 02

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

100

Kod üretimi

100

Çok dilli

Yaratıcı

Bölüm 03

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰

API tarifeleri — Qwen3.5-397B-A17B

$0.7100 1M giriş token başına

$4.25 1M çıkış token başına

≈ $0.0013 tipik konuşma başına (800 token)

Giriş vs çıkış fiyatı (1M token başına)

1M giriş token başına$0.7100

1M çıkış token başına$4.25

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.7100

input / 1M

— stable

$4.25

output / 1M

— stable

2026-06-142026-07-052026-07-19

Input

Output

Price change

⟳ synced weekly

Bölüm 04

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)1124 / avg 877

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 05

Yetenekler

ownedBy: Qwen

Bölüm 06

Kullanılabilirlik

Bu modelin çağrıldığında ne sıklıkla yanıt verdiği — son 30 gün içindeki gerçek API istekleri ve canlı testler üzerinden ölçülmüştür. Bu kaliteden bağımsızdır: bu sayılar yalnızca modelin yanıt verip vermediğini gösterir, yanıtın ne kadar iyi olduğunu değil.

Son 7 gün

—

Son 30 gün

100.0%

n=15

Medyan yanıt süresi

1,177ms

n=15

Baz alınan 395 ölçüm son 30 gün içinde.

Teknik detaylar

Yalnızca gerçek API çağrıları ve canlı test istekleri sayılır — dahili yoklamalar ve kıyaslama çalıştırmaları hariçtir.

Özel API anahtarıyla (BYOK) yapılan çağrılar hariçtir: bu hatalar anahtara özgüdür, model kesintisinin işareti değildir.

Başarısız çağrılar kalite puanlarına DAHİL EDİLMEZ — kalite yalnızca başarılı yanıtlar üzerinden ölçülür. Kullanılabilirlik ve kalite bağımsız sinyallerdir.

Kaydedilmiş süreye sahip başarılı çağrılarda medyan yanıt süresi (p50). Aykırı değerler medyanı ortalamadan daha az etkiler.

Toplam çağrı (30d)

OK yanıtlar (30d)

Toplam çağrı (7d)

OK yanıtlar (7d)

Bölüm 07

Tokonomix kıyaslama kararları

⚖️

Endorsed by 1 judge

Independent LLM judges evaluated this model on our weekly intelligence tests

claude-sonnet-4-541/100 · 42 runs

14 correct1 partial27 wrong33% accuracy

● 2026-07-19

Qwen3.5-397B-A17B jumps to 81.7/100 with creative gains, reasoning still absent

Qwen3.5-397B-A17B demonstrates a remarkable recovery with an overall quality score of 81.7, up 39.2 points from the previous window's 42.4. The model now achieves perfect scores in both coding and multilingual categories at 100 each, maintaining its strong coding performance while dramatically improving multilingual capabilities from 33. The most significant shift appears in creative tasks, which climbed from zero in the implied previous state to 45, though this remains the weakest category. However, reasoning capabilities remain completely absent with no score recorded in this window, consistent with the zero score from the previous period. Latency has increased modestly from 4725ms to 5235ms at the median, representing an approximately 11% slowdown. The test methodology remains consistent with 5 runs in each window. Users requiring strong coding and multilingual support will find this model highly capable, but those needing creative writing or reasoning tasks should be aware of the model's limitations in these areas. The dramatic quality improvement suggests either infrastructure enhancements or model configuration changes at the OVH GRA endpoint.

Quality

81.7

Latency p50

5,235 ms

Test runs

✓ Quality jumped 39.2 points✓ Multilingual improved to perfect 100✓ Creative emerged at 45✗ Latency increased 11%

Son otomatik test

25 Tem 2026 · 02:01 UTC · Hız testi

P50 gecikme

178 ms

P95 gecikme

236 ms

Hatalar

0 / 6 çalıştırma

Son inceleyen Tokonomix Ekibi·25 Temmuz 2026