Naar inhoud
Draait in:FranceGemaakt in:France
OVH AI Endpoints (GRA)

Mistral-Nemo-Instruct-2407

Tokonomix-redactie·Gecontroleerd door Mes Kalkan··
Sectie 01

Snelheidsanalyse

Latency gemeten over alle benchmark-runs. P50 (mediaan) en P95 (95e percentiel) geven een realistisch beeld van de responssnelheid onder normale en piekbelasting.

P50 latency (mediaan)P95 latency73 runs
9172213531984261505-2806-15ms
Sectie 02

Kwaliteitsscores

Evaluatieresultaten van judge-model beoordelingen over diverse taakcategorieën. Scores weerspiegelen coherentie, accuratesse en instructieopvolging.

100
Code generatie
93
Meertaligheid
75
Redeneren
Sectie 03

Prijsgeschiedenis

Directe provider-tarieven per miljoen tokens, plus een typische gespreks-kostschatting.

💰
API-tarieven — Mistral-Nemo-Instruct-2407
$0.1300 per 1M input-tokens
$0.1300 per 1M output-tokens
≈ $0.0001 per typisch gesprek (800 tokens)
Input vs output prijs (per 1M tokens)
per 1M input-tokens$0.1300
per 1M output-tokens$0.1300

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.1300

input / 1M

— stable

$0.1300

output / 1M

— stable

2026-06-142026-06-142026-06-14
Input
Output
Price change
⟳ synced weekly
Sectie 04

Tokens per seconde

Doorvoersnelheid in tokens per seconde, afgeleid uit gemeten P50-latency. Hogere waarden zijn beter; fluctuaties weerspiegelen serverbelasting bij de provider.

Doorvoer (tokens / s)1709 / avg 1509
2157426

Geschat uit P50-latency × 200 output-tokens — het absolute getal hangt af van deze aanname; de trend is wat telt.

Sectie 05

Mogelijkheden

ownedBy: mistralai
Sectie 06

Beschikbaarheid

Beschikbaarheid

Nog geen meetdata

Er zijn nog niet genoeg API-aanroepen geregistreerd om beschikbaarheidsstatistieken voor dit model te tonen. Data verschijnt zodra het model live verkeer ontvangt.

Sectie 07

Tokonomix benchmark-oordelen

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-585/100 · 7 runs
5 correct1 partial1 wrong71% accuracy
2026-06-14

Mistral-Nemo maintains steady baseline with no performance variation

Mistral-Nemo-Instruct-2407 continues to deliver consistent performance across this benchmark window with no measurable changes from the previous period. The model maintains its established baseline characteristics without regression or improvement in any tracked metrics. This stability indicates reliable model serving infrastructure from OVH AI Endpoints in their GRA region, with consistent response patterns and quality outputs. Users can expect the same mid-tier performance levels that were observed during the initial benchmark establishment. The lack of variation suggests no underlying model updates, infrastructure changes, or optimization adjustments have been deployed during this period. For production workloads requiring predictable behavior, this consistency provides operational confidence. However, users seeking performance improvements or enhanced capabilities will need to look at model updates in future releases or consider alternative offerings. The stable serving pattern makes capacity planning and resource allocation straightforward for applications built on this endpoint.

Quality

Latency p50

Test runs

0

Performance remains stable No quality regressions detected No performance improvements observed
Laatste automatische test
15 jun 2026 · 08:00 UTC · Snelheidstest
P50 latency
117 ms
P95 latency
191 ms
Fouten
0 / 6 runs
Laatst beoordeeld door Tokonomix-team·15 juni 2026