Tier C — Especialista

Se ejecuta en:FranceCreado en:France

Mistral-Nemo-Instruct-2407

Tier C — Especialista

Equipo editorial Tokonomix·Revisado por Mes Kalkan·Publicado 27 de mayo de 2026·Última revisión 30 de julio de 2026

Sección 01

Análisis de velocidad

Latencia medida en todas las ejecuciones de benchmark. P50 (mediana) y P95 (percentil 95) dan una imagen realista de la velocidad de respuesta bajo carga normal y máxima.

Latencia P50 (mediana)Latencia P95101 runs

Sección 02

Puntuaciones de calidad

Resultados de evaluación de modelos juez en diversas categorías de tareas. Las puntuaciones reflejan coherencia, precisión y seguimiento de instrucciones.

Creativo

Factual

Multilingüe

Razonamiento

Sección 03

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰

Tarifas API — Mistral-Nemo-Instruct-2407

$0.1300 por 1M de tokens de entrada

$0.1300 por 1M de tokens de salida

≈ $0.0001 por conversación típica (800 tokens)

Precio entrada vs salida (por 1M de tokens)

por 1M de tokens de entrada$0.1300

por 1M de tokens de salida$0.1300

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.1300

input / 1M

— stable

$0.1300

output / 1M

— stable

2026-06-142026-07-052026-07-26

Input

Output

Price change

⟳ synced weekly

Sección 04

Tokens por segundo

Rendimiento en tokens por segundo, derivado de la latencia P50 medida. Más alto es mejor; las fluctuaciones reflejan la carga del lado del proveedor.

Rendimiento (tokens / s)2000 / avg 1943

Estimado a partir de latencia P50 × 200 tokens de salida — el número absoluto depende de esta suposición; lo que importa es la tendencia.

Sección 05

Capacidades

ownedBy: mistralai

Sección 06

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 07

Veredictos del benchmark Tokonomix

⚖️

Endorsed by 2 judges

Independent LLM judges evaluated this model on our weekly intelligence tests

cohere/command-a20/100 · 1 runs

0 correct1 partial0 wrong0% accuracy

claude-sonnet-4-578/100 · 47 runs

31 correct6 partial10 wrong66% accuracy

● 2026-07-26

Mistral-Nemo quality plummets 38 points to 46.8, latency up 43%

Mistral-Nemo-Instruct-2407 on OVH AI Endpoints has experienced a severe performance degradation in the current benchmark window. Overall quality dropped dramatically from 84.9 to 46.8, representing a 38.1 point decline that affects nearly all measured capabilities. The multilingual category saw the most significant collapse, falling from 97 to just 26. Creative performance dropped from 75 to 58, while the model now scores 50 in factual tasks and 53 in reasoning. These new categories replace the previously measured coding capability, which scored 83 in the last window. Latency has also deteriorated substantially, with p50 response times increasing 43% from 3051ms to 4372ms. This combination of quality collapse and slower response times suggests either a model version change, infrastructure issues, or configuration problems at the provider level. The stability between benchmark windows has clearly been compromised. Users should exercise caution and potentially consider alternative providers or models until performance stabilizes and returns to previously demonstrated levels.

Quality

46.8

Latency p50

4,372 ms

Test runs

✗ Quality crashed 38.1 points✗ Multilingual dropped from 97 to 26✗ Latency increased 43%✗ Creative performance down 17 points

Última prueba automática

30 jul 2026 · 08:04 UTC · Benchmark de velocidad

Latencia P50

100 ms

Latencia P95

322 ms

Errores

0 / 6 ejecuciones

Última revisión por Equipo Tokonomix·30 de julio de 2026