Naar inhoud
Draait in:FranceGemaakt in:China
OVH AI Endpoints (GRA)

Qwen3-Coder-30B-A3B-Instruct

Tokonomix-redactie·Gecontroleerd door Mes Kalkan··
Sectie 01

Snelheidsanalyse

Latency gemeten over alle benchmark-runs. P50 (mediaan) en P95 (95e percentiel) geven een realistisch beeld van de responssnelheid onder normale en piekbelasting.

P50 latency (mediaan)P95 latency73 runs
59141627744131548805-2806-15ms
Sectie 02

Kwaliteitsscores

Evaluatieresultaten van judge-model beoordelingen over diverse taakcategorieën. Scores weerspiegelen coherentie, accuratesse en instructieopvolging.

100
Code generatie
98
Meertaligheid
100
Redeneren
Sectie 03

Prijsgeschiedenis

Directe provider-tarieven per miljoen tokens, plus een typische gespreks-kostschatting.

💰
API-tarieven — Qwen3-Coder-30B-A3B-Instruct
$0.0700 per 1M input-tokens
$0.2600 per 1M output-tokens
≈ <$0.0001 per typisch gesprek (800 tokens)
Input vs output prijs (per 1M tokens)
per 1M input-tokens$0.0700
per 1M output-tokens$0.2600

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.0700

input / 1M

— stable

$0.2600

output / 1M

— stable

2026-06-142026-06-142026-06-14
Input
Output
Price change
⟳ synced weekly
Sectie 04

Tokens per seconde

Doorvoersnelheid in tokens per seconde, afgeleid uit gemeten P50-latency. Hogere waarden zijn beter; fluctuaties weerspiegelen serverbelasting bij de provider.

Doorvoer (tokens / s)380 / avg 1070
3334177

Geschat uit P50-latency × 200 output-tokens — het absolute getal hangt af van deze aanname; de trend is wat telt.

Sectie 05

Mogelijkheden

ownedBy: Qwen
Sectie 06

Beschikbaarheid

Beschikbaarheid

Nog geen meetdata

Er zijn nog niet genoeg API-aanroepen geregistreerd om beschikbaarheidsstatistieken voor dit model te tonen. Data verschijnt zodra het model live verkeer ontvangt.

Sectie 07

Tokonomix benchmark-oordelen

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-592/100 · 7 runs
6 correct0 partial1 wrong86% accuracy
2026-06-14

Pricing updated, performance metrics remain stable

The Qwen3-Coder-30B-A3B-Instruct model from OVH AI Endpoints maintains consistent performance characteristics following a pricing update. The model continues to demonstrate strong coding capabilities with no measurable changes in throughput, latency, or quality metrics between benchmark windows. Users can expect the same operational performance they experienced previously, with stable response times and code generation quality. The absence of performance data changes indicates reliable infrastructure and consistent model behavior. This stability is particularly valuable for production environments where predictable behavior matters. The coding-focused architecture continues to serve its intended use case without degradation. For teams already using this endpoint, the update should be transparent from a technical perspective, requiring no adjustments to integration patterns or performance expectations. New users evaluating this model can reference both current and previous benchmark data with confidence that results remain representative of actual performance. The pricing adjustment appears to be an isolated business decision without technical implications for model operation or capability.

Quality

Latency p50

Test runs

0

Performance metrics remain stable Consistent coding capabilities maintained
Laatste automatische test
15 jun 2026 · 08:00 UTC · Snelheidstest
P50 latency
526 ms
P95 latency
570 ms
Fouten
0 / 6 runs
Laatst beoordeeld door Tokonomix-team·15 juni 2026