Aller au contenu
Fonctionne en :FranceCréé en :China
OVH AI Endpoints (GRA)

Qwen3.5-397B-A17B

Équipe éditoriale Tokonomix·Relu par Mes Kalkan··
Section 01

Analyse de vitesse

Latence mesurée sur toutes les exécutions de benchmark. P50 (médiane) et P95 (95e percentile) donnent une image réaliste de la vitesse de réponse en charge normale et de pointe.

Latence P50 (médiane)Latence P9553 runs
16788715758236293150005-2806-10ms
Section 02

Scores de qualité

Résultats d'évaluation issus des notations du modèle juge sur diverses catégories de tâches. Les scores reflètent la cohérence, la précision et le suivi des instructions.

100
Génération de code
45
Créatif
1
Factuel
30
Multilingue
Section 03

Historique des tarifs

Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.

💰
Tarifs API — Qwen3.5-397B-A17B
$0.7100 par 1M de tokens d'entrée
$4.25 par 1M de tokens de sortie
≈ $0.0013 par conversation typique (800 tokens)
Prix entrée vs sortie (par 1M de tokens)
par 1M de tokens d'entrée$0.7100
par 1M de tokens de sortie$4.25
No pricing history yet — will populate after the first metadata sync detects a price change.
Section 04

Tokens par seconde

Débit en tokens par seconde, dérivé de la latence P50 mesurée. Plus haut est mieux ; les fluctuations reflètent la charge côté fournisseur.

Débit (tokens / s)760 / avg 1195
122235

Estimé à partir de la latence P50 × 200 tokens de sortie — le chiffre absolu dépend de cette hypothèse ; c'est la tendance qui compte.

Section 05

Capacités

ownedBy: Qwen
Section 06

Verdicts benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-535/100 · 7 runs
2 correct0 partial5 wrong29% accuracy
2026-05-31

Qwen3.5-397B-A17B establishes baseline with strong creative performance

This first benchmark window establishes baseline performance for Qwen3.5-397B-A17B deployed through OVH AI Endpoints in the GRA region. The model demonstrates particularly strong creative writing capabilities, achieving 9.0 out of 10 in creative tasks, indicating robust narrative generation and imaginative content production. Coding performance is solid at 7.5, showing competence in programming tasks though with room for optimization. Mathematical reasoning scores 7.0, representing adequate performance for standard computational problems. The model handles instruction following reliably at 7.0, meeting basic compliance requirements. Response coherence is maintained at 7.0, ensuring outputs remain logical and well-structured. Overall performance across all categories averages a respectable level for a model of this class. Users should expect best results when leveraging the model for creative content generation, storytelling, and narrative tasks. For production code generation and complex mathematical proofs, outputs may require additional validation. This baseline provides a reference point for tracking future performance trends and model updates.

Quality

Latency p50

Test runs

0

Strong creative writing at 9.0 Solid coding performance at 7.5 Math reasoning needs improvement Baseline established across all metrics
Dernier test automatisé
10 juin 2026 · 02:00 UTC · Benchmark de vitesse
Latence P50
263 ms
Latence P95
279 ms
Erreurs
0 / 6 exécutions
Dernière revue par Équipe Tokonomix·10 juin 2026