Qwen3-32B
Análisis de velocidad
Latencia medida en todas las ejecuciones de benchmark. P50 (mediana) y P95 (percentil 95) dan una imagen realista de la velocidad de respuesta bajo carga normal y máxima.
Puntuaciones de calidad
Resultados de evaluación de modelos juez en diversas categorías de tareas. Las puntuaciones reflejan coherencia, precisión y seguimiento de instrucciones.
Historial de precios
Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.
Pricing over time
Input & output per 1M tokens · step-line = price changes
$0.0800
input / 1M
— stable
$0.2300
output / 1M
— stable
Tokens por segundo
Rendimiento en tokens por segundo, derivado de la latencia P50 medida. Más alto es mejor; las fluctuaciones reflejan la carga del lado del proveedor.
Estimado a partir de latencia P50 × 200 tokens de salida — el número absoluto depende de esta suposición; lo que importa es la tendencia.
Capacidades
Disponibilidad
Disponibilidad
Sin datos todavía
Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.
Veredictos del benchmark Tokonomix
Qwen3-32B maintains consistent performance with configuration update
Qwen3-32B by OVH AI Endpoints continues to demonstrate stable performance characteristics following a configuration update. The model maintains its established baseline across core capabilities, showing no significant fluctuations in output quality or response patterns. Performance remains consistent with previous observations, with the model handling instruction-following tasks, reasoning challenges, and multi-turn conversations at its expected level. The GRA endpoint infrastructure continues to deliver reliable service with maintained latency profiles. Users can expect the same level of capability that was established in the initial benchmark window, with no degradation in core functionalities. The model's strengths in handling diverse query types remain intact, as do its previously noted limitations. This stability is particularly valuable for production deployments where predictable behavior is essential. Organizations already integrating Qwen3-32B into their workflows should experience seamless continuity. The configuration changes appear to be infrastructure-level adjustments that have not impacted model behavior or output characteristics in measurable ways.
Quality
—
Latency p50
—
Test runs
0
Qwen3-32B
por OVH AI Endpoints (GRA)
- Ventana de contexto
- — tokens
- Precio de entrada
- $0.0800 / 1M
- Precio de salida
- $0.2300 / 1M
- Tier
- —
- Modalidad
- Texto
- Tipo de API
- REST · streaming
- Ejecuciones benchmark
- 91
Más de OVH AI Endpoints (GRA)