Ir al contenido
Se ejecuta en:FranceCreado en:China
OVH AI Endpoints (GRA)

Qwen3.5-397B-A17B

Equipo editorial Tokonomix·Revisado por Mes Kalkan··
Sección 01

Análisis de velocidad

Latencia medida en todas las ejecuciones de benchmark. P50 (mediana) y P95 (percentil 95) dan una imagen realista de la velocidad de respuesta bajo carga normal y máxima.

Latencia P50 (mediana)Latencia P9553 runs
16788715758236293150005-2806-10ms
Sección 02

Puntuaciones de calidad

Resultados de evaluación de modelos juez en diversas categorías de tareas. Las puntuaciones reflejan coherencia, precisión y seguimiento de instrucciones.

100
Generación de código
45
Creativo
1
Factual
30
Multilingüe
Sección 03

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰
Tarifas API — Qwen3.5-397B-A17B
$0.7100 por 1M de tokens de entrada
$4.25 por 1M de tokens de salida
≈ $0.0013 por conversación típica (800 tokens)
Precio entrada vs salida (por 1M de tokens)
por 1M de tokens de entrada$0.7100
por 1M de tokens de salida$4.25
No pricing history yet — will populate after the first metadata sync detects a price change.
Sección 04

Tokens por segundo

Rendimiento en tokens por segundo, derivado de la latencia P50 medida. Más alto es mejor; las fluctuaciones reflejan la carga del lado del proveedor.

Rendimiento (tokens / s)760 / avg 1195
122235

Estimado a partir de latencia P50 × 200 tokens de salida — el número absoluto depende de esta suposición; lo que importa es la tendencia.

Sección 05

Capacidades

ownedBy: Qwen
Sección 06

Veredictos del benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-535/100 · 7 runs
2 correct0 partial5 wrong29% accuracy
2026-05-31

Qwen3.5-397B-A17B establishes baseline with strong creative performance

This first benchmark window establishes baseline performance for Qwen3.5-397B-A17B deployed through OVH AI Endpoints in the GRA region. The model demonstrates particularly strong creative writing capabilities, achieving 9.0 out of 10 in creative tasks, indicating robust narrative generation and imaginative content production. Coding performance is solid at 7.5, showing competence in programming tasks though with room for optimization. Mathematical reasoning scores 7.0, representing adequate performance for standard computational problems. The model handles instruction following reliably at 7.0, meeting basic compliance requirements. Response coherence is maintained at 7.0, ensuring outputs remain logical and well-structured. Overall performance across all categories averages a respectable level for a model of this class. Users should expect best results when leveraging the model for creative content generation, storytelling, and narrative tasks. For production code generation and complex mathematical proofs, outputs may require additional validation. This baseline provides a reference point for tracking future performance trends and model updates.

Quality

Latency p50

Test runs

0

Strong creative writing at 9.0 Solid coding performance at 7.5 Math reasoning needs improvement Baseline established across all metrics
Última prueba automática
10 jun 2026 · 02:00 UTC · Benchmark de velocidad
Latencia P50
263 ms
Latencia P95
279 ms
Errores
0 / 6 ejecuciones
Última revisión por Equipo Tokonomix·10 de junio de 2026