Tier A — Frontier

Fonctionne en :FranceCréé en :China

Qwen3.5-397B-A17B

Tier A — Frontier

Équipe éditoriale Tokonomix·Relu par Mes Kalkan·Publié le 27 mai 2026·Dernière relecture 25 juillet 2026

Section 01

Analyse de vitesse

Latence mesurée sur toutes les exécutions de benchmark. P50 (médiane) et P95 (95e percentile) donnent une image réaliste de la vitesse de réponse en charge normale et de pointe.

Latence P50 (médiane)Latence P95105 runs

Section 02

Scores de qualité

Résultats d'évaluation issus des notations du modèle juge sur diverses catégories de tâches. Les scores reflètent la cohérence, la précision et le suivi des instructions.

100

Génération de code

100

Multilingue

Créatif

Section 03

Historique des tarifs

Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.

💰

Tarifs API — Qwen3.5-397B-A17B

$0.7100 par 1M de tokens d'entrée

$4.25 par 1M de tokens de sortie

≈ $0.0013 par conversation typique (800 tokens)

Prix entrée vs sortie (par 1M de tokens)

par 1M de tokens d'entrée$0.7100

par 1M de tokens de sortie$4.25

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.7100

input / 1M

— stable

$4.25

output / 1M

— stable

2026-06-142026-07-052026-07-19

Input

Output

Price change

⟳ synced weekly

Section 04

Tokens par seconde

Débit en tokens par seconde, dérivé de la latence P50 mesurée. Plus haut est mieux ; les fluctuations reflètent la charge côté fournisseur.

Débit (tokens / s)1081 / avg 876

Estimé à partir de la latence P50 × 200 tokens de sortie — le chiffre absolu dépend de cette hypothèse ; c'est la tendance qui compte.

Section 05

Capacités

ownedBy: Qwen

Section 06

Disponibilité

La fréquence à laquelle ce modèle répond lorsqu'on l'appelle — mesurée sur de vraies requêtes API et des tests en direct au cours des 30 derniers jours. C'est indépendant de la qualité : ces chiffres indiquent seulement si le modèle répond, pas la qualité de sa réponse.

7 derniers jours

—

30 derniers jours

100.0%

n=15

Temps de réponse médian

1,177ms

n=15

Basé sur 395 mesures au cours des 30 derniers jours.

Détails techniques

Seuls les vrais appels API et les requêtes de test en direct sont comptés — les sondes internes et les benchmarks sont exclus.

Les appels avec une clé API personnalisée (BYOK) sont exclus : ces échecs sont spécifiques à la clé, pas un signe de défaillance du modèle.

Les appels échoués ne sont PAS inclus dans les scores de qualité — la qualité est mesurée uniquement sur les réponses réussies. Disponibilité et qualité sont des signaux indépendants.

Temps de réponse médian (p50) sur les appels réussis avec une durée enregistrée. Les valeurs extrêmes influencent moins la médiane que la moyenne.

Total des appels (30d)

Réponses OK (30d)

Total des appels (7d)

Réponses OK (7d)

Section 07

Verdicts benchmark Tokonomix

⚖️

Endorsed by 1 judge

Independent LLM judges evaluated this model on our weekly intelligence tests

claude-sonnet-4-541/100 · 42 runs

14 correct1 partial27 wrong33% accuracy

● 2026-07-19

Qwen3.5-397B-A17B jumps to 81.7/100 with creative gains, reasoning still absent

Qwen3.5-397B-A17B demonstrates a remarkable recovery with an overall quality score of 81.7, up 39.2 points from the previous window's 42.4. The model now achieves perfect scores in both coding and multilingual categories at 100 each, maintaining its strong coding performance while dramatically improving multilingual capabilities from 33. The most significant shift appears in creative tasks, which climbed from zero in the implied previous state to 45, though this remains the weakest category. However, reasoning capabilities remain completely absent with no score recorded in this window, consistent with the zero score from the previous period. Latency has increased modestly from 4725ms to 5235ms at the median, representing an approximately 11% slowdown. The test methodology remains consistent with 5 runs in each window. Users requiring strong coding and multilingual support will find this model highly capable, but those needing creative writing or reasoning tasks should be aware of the model's limitations in these areas. The dramatic quality improvement suggests either infrastructure enhancements or model configuration changes at the OVH GRA endpoint.

Quality

81.7

Latency p50

5,235 ms

Test runs

✓ Quality jumped 39.2 points✓ Multilingual improved to perfect 100✓ Creative emerged at 45✗ Latency increased 11%

Dernier test automatisé

25 juil. 2026 · 14:00 UTC · Benchmark de vitesse

Latence P50

185 ms

Latence P95

238 ms

Erreurs

0 / 6 exécutions

Dernière revue par Équipe Tokonomix·25 juillet 2026