Qwen3-Coder-30B-A3B-Instruct
Snelheidsanalyse
Latency gemeten over alle benchmark-runs. P50 (mediaan) en P95 (95e percentiel) geven een realistisch beeld van de responssnelheid onder normale en piekbelasting.
Kwaliteitsscores
Evaluatieresultaten van judge-model beoordelingen over diverse taakcategorieën. Scores weerspiegelen coherentie, accuratesse en instructieopvolging.
Prijsgeschiedenis
Directe provider-tarieven per miljoen tokens, plus een typische gespreks-kostschatting.
Pricing over time
Input & output per 1M tokens · step-line = price changes
$0.0700
input / 1M
— stable
$0.2600
output / 1M
— stable
Tokens per seconde
Doorvoersnelheid in tokens per seconde, afgeleid uit gemeten P50-latency. Hogere waarden zijn beter; fluctuaties weerspiegelen serverbelasting bij de provider.
Geschat uit P50-latency × 200 output-tokens — het absolute getal hangt af van deze aanname; de trend is wat telt.
Mogelijkheden
Beschikbaarheid
Beschikbaarheid
Nog geen meetdata
Er zijn nog niet genoeg API-aanroepen geregistreerd om beschikbaarheidsstatistieken voor dit model te tonen. Data verschijnt zodra het model live verkeer ontvangt.
Tokonomix benchmark-oordelen
Pricing updated, performance metrics remain stable
The Qwen3-Coder-30B-A3B-Instruct model from OVH AI Endpoints maintains consistent performance characteristics following a pricing update. The model continues to demonstrate strong coding capabilities with no measurable changes in throughput, latency, or quality metrics between benchmark windows. Users can expect the same operational performance they experienced previously, with stable response times and code generation quality. The absence of performance data changes indicates reliable infrastructure and consistent model behavior. This stability is particularly valuable for production environments where predictable behavior matters. The coding-focused architecture continues to serve its intended use case without degradation. For teams already using this endpoint, the update should be transparent from a technical perspective, requiring no adjustments to integration patterns or performance expectations. New users evaluating this model can reference both current and previous benchmark data with confidence that results remain representative of actual performance. The pricing adjustment appears to be an isolated business decision without technical implications for model operation or capability.
Quality
—
Latency p50
—
Test runs
0
Qwen3-Coder-30B-A3B-Instruct
door OVH AI Endpoints (GRA)
- Contextvenster
- — tokens
- Inputprijs
- $0.0700 / 1M
- Outputprijs
- $0.2600 / 1M
- Tier
- —
- Modaliteit
- Tekst
- API-type
- REST · streaming
- Benchmark-runs
- 91
Meer van OVH AI Endpoints (GRA)