Tier B — Produktion

Läuft in:FranceErstellt in:China

Qwen3-Coder-30B-A3B-Instruct

Tier B — Produktion

Tokonomix-Redaktionsteam·Geprüft von Mes Kalkan·Veröffentlicht 27. Mai 2026·Zuletzt geprüft 30. Juli 2026

Abschnitt 01

Geschwindigkeitsanalyse

Latenz über alle Benchmark-Läufe gemessen. P50 (Median) und P95 (95. Perzentil) zeigen ein realistisches Bild der Antwortgeschwindigkeit bei normaler und Spitzenlast.

P50-Latenz (Median)P95-Latenz101 runs

Abschnitt 02

Qualitätswerte

Auswertungsergebnisse aus Judge-Model-Bewertungen über verschiedene Aufgabenkategorien. Werte spiegeln Kohärenz, Genauigkeit und Anweisungsbefolgung wider.

Kreativ

Faktisch

100

Mehrsprachig

Schlussfolgern

Abschnitt 03

Preisverlauf

Direkte Provider-Tarife pro Million Tokens, plus eine typische Gesprächskostenschätzung.

💰

API-Tarife — Qwen3-Coder-30B-A3B-Instruct

$0.0700 pro 1M Input-Tokens

$0.2600 pro 1M Output-Tokens

≈ <$0.0001 pro typischem Gespräch (800 Tokens)

Input- vs. Output-Preis (pro 1M Tokens)

pro 1M Input-Tokens$0.0700

pro 1M Output-Tokens$0.2600

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.0700

input / 1M

— stable

$0.2600

output / 1M

— stable

2026-06-142026-06-282026-07-26

Input

Output

Price change

⟳ synced weekly

Abschnitt 04

Tokens pro Sekunde

Durchsatz in Tokens pro Sekunde, abgeleitet aus gemessener P50-Latenz. Höhere Werte sind besser; Schwankungen spiegeln die Provider-seitige Last wider.

Durchsatz (Tokens / s)2222 / avg 1425

Geschätzt aus P50-Latenz × 200 Output-Tokens — die absolute Zahl hängt von dieser Annahme ab; entscheidend ist der Trend.

Abschnitt 05

Fähigkeiten

ownedBy: Qwen

Abschnitt 06

Verfügbarkeit

Noch keine Messdaten

Es wurden noch nicht genug API-Aufrufe aufgezeichnet, um Verfügbarkeitsstatistiken für dieses Modell anzuzeigen. Daten erscheinen, sobald das Modell Live-Traffic erhält.

Abschnitt 07

Tokonomix-Benchmark-Urteile

⚖️

Endorsed by 2 judges

Independent LLM judges evaluated this model on our weekly intelligence tests

cohere/command-a100/100 · 1 runs

1 correct0 partial0 wrong100% accuracy

claude-sonnet-4-592/100 · 47 runs

41 correct2 partial4 wrong87% accuracy

● 2026-07-26

Quality drops 9.8 points to 86.5 as category mix shifts from coding

Qwen3-Coder-30B-A3B-Instruct experienced a notable quality decline this window, falling from 96.3 to 86.5 overall. The most significant change is a shift in tested categories, with coding tests absent from the current window while new categories emerged. Multilingual performance remains the model's strongest area, maintaining exceptional scores at 100 compared to 99 previously. Creative work held relatively steady, moving from 90 to 88. However, the newly tested reasoning category scored 75, and factual performance came in at 83, both pulling the overall average down. The absence of coding tests is particularly notable given this model's specialized positioning and its perfect 100 coding score in the previous window. On the positive side, latency improved by 16 percent, dropping from 4655ms to 3913ms at median, making the model more responsive for interactive use cases. With only 5 test runs in each window, these results should be considered preliminary. Users should note that while the model continues to excel at multilingual tasks and maintains decent creative capabilities, the current test mix suggests more variability in reasoning and factual domains than previously observed.

Quality

86.5

Latency p50

3,913 ms

Test runs

✗ Quality dropped 9.8 points✓ Latency improved 16%✓ Multilingual maintains perfect score✗ No coding tests this window

Letzter automatisierter Test

30. Juli 2026 · 08:05 UTC · Geschwindigkeits-Benchmark

P50-Latenz

90 ms

P95-Latenz

103 ms

Fehler

0 / 6 Läufe

Zuletzt geprüft von Tokonomix-Team·30. Juli 2026