Mistral-Nemo-Instruct-2407
Análisis de velocidad
Latencia medida en todas las ejecuciones de benchmark. P50 (mediana) y P95 (percentil 95) dan una imagen realista de la velocidad de respuesta bajo carga normal y máxima.
Puntuaciones de calidad
Resultados de evaluación de modelos juez en diversas categorías de tareas. Las puntuaciones reflejan coherencia, precisión y seguimiento de instrucciones.
Historial de precios
Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.
Pricing over time
Input & output per 1M tokens · step-line = price changes
$0.1300
input / 1M
— stable
$0.1300
output / 1M
— stable
Tokens por segundo
Rendimiento en tokens por segundo, derivado de la latencia P50 medida. Más alto es mejor; las fluctuaciones reflejan la carga del lado del proveedor.
Estimado a partir de latencia P50 × 200 tokens de salida — el número absoluto depende de esta suposición; lo que importa es la tendencia.
Capacidades
Disponibilidad
Disponibilidad
Sin datos todavía
Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.
Veredictos del benchmark Tokonomix
Mistral-Nemo maintains steady baseline with no performance variation
Mistral-Nemo-Instruct-2407 continues to deliver consistent performance across this benchmark window with no measurable changes from the previous period. The model maintains its established baseline characteristics without regression or improvement in any tracked metrics. This stability indicates reliable model serving infrastructure from OVH AI Endpoints in their GRA region, with consistent response patterns and quality outputs. Users can expect the same mid-tier performance levels that were observed during the initial benchmark establishment. The lack of variation suggests no underlying model updates, infrastructure changes, or optimization adjustments have been deployed during this period. For production workloads requiring predictable behavior, this consistency provides operational confidence. However, users seeking performance improvements or enhanced capabilities will need to look at model updates in future releases or consider alternative offerings. The stable serving pattern makes capacity planning and resource allocation straightforward for applications built on this endpoint.
Quality
—
Latency p50
—
Test runs
0
Mistral-Nemo-Instruct-2407
por OVH AI Endpoints (GRA)
- Ventana de contexto
- — tokens
- Precio de entrada
- $0.1300 / 1M
- Precio de salida
- $0.1300 / 1M
- Tier
- —
- Modalidad
- Texto
- Tipo de API
- REST · streaming
- Ejecuciones benchmark
- 91
Más de OVH AI Endpoints (GRA)