Aller au contenu
Fonctionne en :FranceCréé en :France
OVH AI Endpoints (GRA)

Mistral-Nemo-Instruct-2407

Équipe éditoriale Tokonomix·Relu par Mes Kalkan··
Section 01

Analyse de vitesse

Latence mesurée sur toutes les exécutions de benchmark. P50 (médiane) et P95 (95e percentile) donnent une image réaliste de la vitesse de réponse en charge normale et de pointe.

Latence P50 (médiane)Latence P9573 runs
9172213531984261505-2806-15ms
Section 02

Scores de qualité

Résultats d'évaluation issus des notations du modèle juge sur diverses catégories de tâches. Les scores reflètent la cohérence, la précision et le suivi des instructions.

100
Génération de code
93
Multilingue
75
Raisonnement
Section 03

Historique des tarifs

Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.

💰
Tarifs API — Mistral-Nemo-Instruct-2407
$0.1300 par 1M de tokens d'entrée
$0.1300 par 1M de tokens de sortie
≈ $0.0001 par conversation typique (800 tokens)
Prix entrée vs sortie (par 1M de tokens)
par 1M de tokens d'entrée$0.1300
par 1M de tokens de sortie$0.1300

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.1300

input / 1M

— stable

$0.1300

output / 1M

— stable

2026-06-142026-06-142026-06-14
Input
Output
Price change
⟳ synced weekly
Section 04

Tokens par seconde

Débit en tokens par seconde, dérivé de la latence P50 mesurée. Plus haut est mieux ; les fluctuations reflètent la charge côté fournisseur.

Débit (tokens / s)1709 / avg 1509
2157426

Estimé à partir de la latence P50 × 200 tokens de sortie — le chiffre absolu dépend de cette hypothèse ; c'est la tendance qui compte.

Section 05

Capacités

ownedBy: mistralai
Section 06

Disponibilité

Disponibilité

Pas encore de données

Nous n'avons pas encore enregistré suffisamment d'appels API pour afficher les statistiques de disponibilité de ce modèle. Les données apparaîtront dès que le modèle reçoit du trafic en direct.

Section 07

Verdicts benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-585/100 · 7 runs
5 correct1 partial1 wrong71% accuracy
2026-06-14

Mistral-Nemo maintains steady baseline with no performance variation

Mistral-Nemo-Instruct-2407 continues to deliver consistent performance across this benchmark window with no measurable changes from the previous period. The model maintains its established baseline characteristics without regression or improvement in any tracked metrics. This stability indicates reliable model serving infrastructure from OVH AI Endpoints in their GRA region, with consistent response patterns and quality outputs. Users can expect the same mid-tier performance levels that were observed during the initial benchmark establishment. The lack of variation suggests no underlying model updates, infrastructure changes, or optimization adjustments have been deployed during this period. For production workloads requiring predictable behavior, this consistency provides operational confidence. However, users seeking performance improvements or enhanced capabilities will need to look at model updates in future releases or consider alternative offerings. The stable serving pattern makes capacity planning and resource allocation straightforward for applications built on this endpoint.

Quality

Latency p50

Test runs

0

Performance remains stable No quality regressions detected No performance improvements observed
Dernier test automatisé
15 juin 2026 · 08:00 UTC · Benchmark de vitesse
Latence P50
117 ms
Latence P95
191 ms
Erreurs
0 / 6 exécutions
Dernière revue par Équipe Tokonomix·15 juin 2026