Qwen3.5-397B-A17B
Geschwindigkeitsanalyse
Latenz über alle Benchmark-Läufe gemessen. P50 (Median) und P95 (95. Perzentil) zeigen ein realistisches Bild der Antwortgeschwindigkeit bei normaler und Spitzenlast.
Qualitätswerte
Auswertungsergebnisse aus Judge-Model-Bewertungen über verschiedene Aufgabenkategorien. Werte spiegeln Kohärenz, Genauigkeit und Anweisungsbefolgung wider.
Preisverlauf
Direkte Provider-Tarife pro Million Tokens, plus eine typische Gesprächskostenschätzung.
Tokens pro Sekunde
Durchsatz in Tokens pro Sekunde, abgeleitet aus gemessener P50-Latenz. Höhere Werte sind besser; Schwankungen spiegeln die Provider-seitige Last wider.
Geschätzt aus P50-Latenz × 200 Output-Tokens — die absolute Zahl hängt von dieser Annahme ab; entscheidend ist der Trend.
Fähigkeiten
Tokonomix-Benchmark-Urteile
Qwen3.5-397B-A17B establishes baseline with strong creative performance
This first benchmark window establishes baseline performance for Qwen3.5-397B-A17B deployed through OVH AI Endpoints in the GRA region. The model demonstrates particularly strong creative writing capabilities, achieving 9.0 out of 10 in creative tasks, indicating robust narrative generation and imaginative content production. Coding performance is solid at 7.5, showing competence in programming tasks though with room for optimization. Mathematical reasoning scores 7.0, representing adequate performance for standard computational problems. The model handles instruction following reliably at 7.0, meeting basic compliance requirements. Response coherence is maintained at 7.0, ensuring outputs remain logical and well-structured. Overall performance across all categories averages a respectable level for a model of this class. Users should expect best results when leveraging the model for creative content generation, storytelling, and narrative tasks. For production code generation and complex mathematical proofs, outputs may require additional validation. This baseline provides a reference point for tracking future performance trends and model updates.
Quality
—
Latency p50
—
Test runs
0
Qwen3.5-397B-A17B
von OVH AI Endpoints (GRA)
- Kontextfenster
- — tokens
- Eingabepreis
- $0.7100 / 1M
- Ausgabepreis
- $4.25 / 1M
- Tier
- —
- Modalität
- Text
- API-Typ
- REST · Streaming
- Benchmark-Läufe
- 66
Mehr von OVH AI Endpoints (GRA)