Tier B — Production

Fonctionne en :FranceCréé en :China

Qwen3-Coder-30B-A3B-Instruct

Tier B — Production

Équipe éditoriale Tokonomix·Relu par Mes Kalkan·Publié le 27 mai 2026·Dernière relecture 30 juillet 2026

Section 01

Analyse de vitesse

Latence mesurée sur toutes les exécutions de benchmark. P50 (médiane) et P95 (95e percentile) donnent une image réaliste de la vitesse de réponse en charge normale et de pointe.

Latence P50 (médiane)Latence P95101 runs

Section 02

Scores de qualité

Résultats d'évaluation issus des notations du modèle juge sur diverses catégories de tâches. Les scores reflètent la cohérence, la précision et le suivi des instructions.

Créatif

Factuel

100

Multilingue

Raisonnement

Section 03

Historique des tarifs

Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.

💰

Tarifs API — Qwen3-Coder-30B-A3B-Instruct

$0.0700 par 1M de tokens d'entrée

$0.2600 par 1M de tokens de sortie

≈ <$0.0001 par conversation typique (800 tokens)

Prix entrée vs sortie (par 1M de tokens)

par 1M de tokens d'entrée$0.0700

par 1M de tokens de sortie$0.2600

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.0700

input / 1M

— stable

$0.2600

output / 1M

— stable

2026-06-142026-06-282026-07-26

Input

Output

Price change

⟳ synced weekly

Section 04

Tokens par seconde

Débit en tokens par seconde, dérivé de la latence P50 mesurée. Plus haut est mieux ; les fluctuations reflètent la charge côté fournisseur.

Débit (tokens / s)2222 / avg 1425

Estimé à partir de la latence P50 × 200 tokens de sortie — le chiffre absolu dépend de cette hypothèse ; c'est la tendance qui compte.

Section 05

Capacités

ownedBy: Qwen

Section 06

Disponibilité

Pas encore de données

Nous n'avons pas encore enregistré suffisamment d'appels API pour afficher les statistiques de disponibilité de ce modèle. Les données apparaîtront dès que le modèle reçoit du trafic en direct.

Section 07

Verdicts benchmark Tokonomix

⚖️

Endorsed by 2 judges

Independent LLM judges evaluated this model on our weekly intelligence tests

cohere/command-a100/100 · 1 runs

1 correct0 partial0 wrong100% accuracy

claude-sonnet-4-592/100 · 47 runs

41 correct2 partial4 wrong87% accuracy

● 2026-07-26

Quality drops 9.8 points to 86.5 as category mix shifts from coding

Qwen3-Coder-30B-A3B-Instruct experienced a notable quality decline this window, falling from 96.3 to 86.5 overall. The most significant change is a shift in tested categories, with coding tests absent from the current window while new categories emerged. Multilingual performance remains the model's strongest area, maintaining exceptional scores at 100 compared to 99 previously. Creative work held relatively steady, moving from 90 to 88. However, the newly tested reasoning category scored 75, and factual performance came in at 83, both pulling the overall average down. The absence of coding tests is particularly notable given this model's specialized positioning and its perfect 100 coding score in the previous window. On the positive side, latency improved by 16 percent, dropping from 4655ms to 3913ms at median, making the model more responsive for interactive use cases. With only 5 test runs in each window, these results should be considered preliminary. Users should note that while the model continues to excel at multilingual tasks and maintains decent creative capabilities, the current test mix suggests more variability in reasoning and factual domains than previously observed.

Quality

86.5

Latency p50

3,913 ms

Test runs

✗ Quality dropped 9.8 points✓ Latency improved 16%✓ Multilingual maintains perfect score✗ No coding tests this window

Dernier test automatisé

30 juil. 2026 · 08:05 UTC · Benchmark de vitesse

Latence P50

90 ms

Latence P95

103 ms

Erreurs

0 / 6 exécutions

Dernière revue par Équipe Tokonomix·30 juillet 2026