Qwen3-Coder-30B-A3B-Instruct
Geschwindigkeitsanalyse
Latenz über alle Benchmark-Läufe gemessen. P50 (Median) und P95 (95. Perzentil) zeigen ein realistisches Bild der Antwortgeschwindigkeit bei normaler und Spitzenlast.
Qualitätswerte
Auswertungsergebnisse aus Judge-Model-Bewertungen über verschiedene Aufgabenkategorien. Werte spiegeln Kohärenz, Genauigkeit und Anweisungsbefolgung wider.
Preisverlauf
Direkte Provider-Tarife pro Million Tokens, plus eine typische Gesprächskostenschätzung.
Pricing over time
Input & output per 1M tokens · step-line = price changes
$0.0700
input / 1M
— stable
$0.2600
output / 1M
— stable
Tokens pro Sekunde
Durchsatz in Tokens pro Sekunde, abgeleitet aus gemessener P50-Latenz. Höhere Werte sind besser; Schwankungen spiegeln die Provider-seitige Last wider.
Geschätzt aus P50-Latenz × 200 Output-Tokens — die absolute Zahl hängt von dieser Annahme ab; entscheidend ist der Trend.
Fähigkeiten
Verfügbarkeit
Verfügbarkeit
Noch keine Messdaten
Es wurden noch nicht genug API-Aufrufe aufgezeichnet, um Verfügbarkeitsstatistiken für dieses Modell anzuzeigen. Daten erscheinen, sobald das Modell Live-Traffic erhält.
Tokonomix-Benchmark-Urteile
Pricing updated, performance metrics remain stable
The Qwen3-Coder-30B-A3B-Instruct model from OVH AI Endpoints maintains consistent performance characteristics following a pricing update. The model continues to demonstrate strong coding capabilities with no measurable changes in throughput, latency, or quality metrics between benchmark windows. Users can expect the same operational performance they experienced previously, with stable response times and code generation quality. The absence of performance data changes indicates reliable infrastructure and consistent model behavior. This stability is particularly valuable for production environments where predictable behavior matters. The coding-focused architecture continues to serve its intended use case without degradation. For teams already using this endpoint, the update should be transparent from a technical perspective, requiring no adjustments to integration patterns or performance expectations. New users evaluating this model can reference both current and previous benchmark data with confidence that results remain representative of actual performance. The pricing adjustment appears to be an isolated business decision without technical implications for model operation or capability.
Quality
—
Latency p50
—
Test runs
0
Qwen3-Coder-30B-A3B-Instruct
von OVH AI Endpoints (GRA)
- Kontextfenster
- — tokens
- Eingabepreis
- $0.0700 / 1M
- Ausgabepreis
- $0.2600 / 1M
- Tier
- —
- Modalität
- Text
- API-Typ
- REST · Streaming
- Benchmark-Läufe
- 91
Mehr von OVH AI Endpoints (GRA)