İçeriğe geç
Çalıştığı yer:FranceYapıldığı yer:China
OVH AI Endpoints (GRA)

Qwen3.5-397B-A17B

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··
Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme53 runs
16788715758236293150005-2806-10ms
Bölüm 02

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

100
Kod üretimi
45
Yaratıcı
1
Olgusal
30
Çok dilli
Bölüm 03

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — Qwen3.5-397B-A17B
$0.7100 1M giriş token başına
$4.25 1M çıkış token başına
≈ $0.0013 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$0.7100
1M çıkış token başına$4.25
No pricing history yet — will populate after the first metadata sync detects a price change.
Bölüm 04

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)760 / avg 1195
122235

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 05

Yetenekler

ownedBy: Qwen
Bölüm 06

Tokonomix kıyaslama kararları

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-535/100 · 7 runs
2 correct0 partial5 wrong29% accuracy
2026-05-31

Qwen3.5-397B-A17B establishes baseline with strong creative performance

This first benchmark window establishes baseline performance for Qwen3.5-397B-A17B deployed through OVH AI Endpoints in the GRA region. The model demonstrates particularly strong creative writing capabilities, achieving 9.0 out of 10 in creative tasks, indicating robust narrative generation and imaginative content production. Coding performance is solid at 7.5, showing competence in programming tasks though with room for optimization. Mathematical reasoning scores 7.0, representing adequate performance for standard computational problems. The model handles instruction following reliably at 7.0, meeting basic compliance requirements. Response coherence is maintained at 7.0, ensuring outputs remain logical and well-structured. Overall performance across all categories averages a respectable level for a model of this class. Users should expect best results when leveraging the model for creative content generation, storytelling, and narrative tasks. For production code generation and complex mathematical proofs, outputs may require additional validation. This baseline provides a reference point for tracking future performance trends and model updates.

Quality

Latency p50

Test runs

0

Strong creative writing at 9.0 Solid coding performance at 7.5 Math reasoning needs improvement Baseline established across all metrics
Son otomatik test
10 Haz 2026 · 02:00 UTC · Hız testi
P50 gecikme
263 ms
P95 gecikme
279 ms
Hatalar
0 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·10 Haziran 2026