Zum Inhalt
Läuft in:FranceErstellt in:China
OVH AI Endpoints (GRA)

Qwen3.5-397B-A17B

Tokonomix-Redaktionsteam·Geprüft von Mes Kalkan··
Abschnitt 01

Geschwindigkeitsanalyse

Latenz über alle Benchmark-Läufe gemessen. P50 (Median) und P95 (95. Perzentil) zeigen ein realistisches Bild der Antwortgeschwindigkeit bei normaler und Spitzenlast.

P50-Latenz (Median)P95-Latenz53 runs
16788715758236293150005-2806-10ms
Abschnitt 02

Qualitätswerte

Auswertungsergebnisse aus Judge-Model-Bewertungen über verschiedene Aufgabenkategorien. Werte spiegeln Kohärenz, Genauigkeit und Anweisungsbefolgung wider.

100
Codegenerierung
45
Kreativ
1
Faktisch
30
Mehrsprachig
Abschnitt 03

Preisverlauf

Direkte Provider-Tarife pro Million Tokens, plus eine typische Gesprächskostenschätzung.

💰
API-Tarife — Qwen3.5-397B-A17B
$0.7100 pro 1M Input-Tokens
$4.25 pro 1M Output-Tokens
≈ $0.0013 pro typischem Gespräch (800 Tokens)
Input- vs. Output-Preis (pro 1M Tokens)
pro 1M Input-Tokens$0.7100
pro 1M Output-Tokens$4.25
No pricing history yet — will populate after the first metadata sync detects a price change.
Abschnitt 04

Tokens pro Sekunde

Durchsatz in Tokens pro Sekunde, abgeleitet aus gemessener P50-Latenz. Höhere Werte sind besser; Schwankungen spiegeln die Provider-seitige Last wider.

Durchsatz (Tokens / s)760 / avg 1195
122235

Geschätzt aus P50-Latenz × 200 Output-Tokens — die absolute Zahl hängt von dieser Annahme ab; entscheidend ist der Trend.

Abschnitt 05

Fähigkeiten

ownedBy: Qwen
Abschnitt 06

Tokonomix-Benchmark-Urteile

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-535/100 · 7 runs
2 correct0 partial5 wrong29% accuracy
2026-05-31

Qwen3.5-397B-A17B establishes baseline with strong creative performance

This first benchmark window establishes baseline performance for Qwen3.5-397B-A17B deployed through OVH AI Endpoints in the GRA region. The model demonstrates particularly strong creative writing capabilities, achieving 9.0 out of 10 in creative tasks, indicating robust narrative generation and imaginative content production. Coding performance is solid at 7.5, showing competence in programming tasks though with room for optimization. Mathematical reasoning scores 7.0, representing adequate performance for standard computational problems. The model handles instruction following reliably at 7.0, meeting basic compliance requirements. Response coherence is maintained at 7.0, ensuring outputs remain logical and well-structured. Overall performance across all categories averages a respectable level for a model of this class. Users should expect best results when leveraging the model for creative content generation, storytelling, and narrative tasks. For production code generation and complex mathematical proofs, outputs may require additional validation. This baseline provides a reference point for tracking future performance trends and model updates.

Quality

Latency p50

Test runs

0

Strong creative writing at 9.0 Solid coding performance at 7.5 Math reasoning needs improvement Baseline established across all metrics
Letzter automatisierter Test
10. Juni 2026 · 02:00 UTC · Geschwindigkeits-Benchmark
P50-Latenz
263 ms
P95-Latenz
279 ms
Fehler
0 / 6 Läufe
Zuletzt geprüft von Tokonomix-Team·10. Juni 2026