Llama-3.1-8B-Instruct
Analyse de vitesse
Latence mesurée sur toutes les exécutions de benchmark. P50 (médiane) et P95 (95e percentile) donnent une image réaliste de la vitesse de réponse en charge normale et de pointe.
Scores de qualité
Résultats d'évaluation issus des notations du modèle juge sur diverses catégories de tâches. Les scores reflètent la cohérence, la précision et le suivi des instructions.
Historique des tarifs
Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.
Pricing over time
Input & output per 1M tokens · step-line = price changes
$0.1000
input / 1M
— stable
$0.1000
output / 1M
— stable
Tokens par seconde
Débit en tokens par seconde, dérivé de la latence P50 mesurée. Plus haut est mieux ; les fluctuations reflètent la charge côté fournisseur.
Estimé à partir de la latence P50 × 200 tokens de sortie — le chiffre absolu dépend de cette hypothèse ; c'est la tendance qui compte.
Capacités
Disponibilité
Disponibilité
Pas encore de données
Nous n'avons pas encore enregistré suffisamment d'appels API pour afficher les statistiques de disponibilité de ce modèle. Les données apparaîtront dès que le modèle reçoit du trafic en direct.
Verdicts benchmark Tokonomix
No performance data available in current benchmark window
The current benchmark window shows no test runs or performance data for Llama-3.1-8B-Instruct by OVH AI Endpoints. This represents a complete absence of measurable results compared to the previous window, which recorded an overall quality score of 95.0 out of 100 with strong multilingual performance at 95 points and a p50 latency of 12823 milliseconds. Without current data, it is impossible to assess whether the model maintains its previous performance levels or has experienced changes in quality, latency, or reliability. The lack of test runs could indicate service availability issues, endpoint configuration changes, or gaps in benchmark coverage during this measurement period. Users should be aware that the previous benchmark established a baseline showing capable performance, particularly in multilingual tasks. However, the absence of current validation data means there is no recent confirmation of model behavior or performance characteristics. Organizations relying on this endpoint should verify availability and conduct their own testing before deploying production workloads until new benchmark data becomes available.
Quality
—
Latency p50
—
Test runs
0
Llama-3.1-8B-Instruct
par OVH AI Endpoints (GRA)
- Fenêtre de contexte
- — tokens
- Prix d'entrée
- $0.1000 / 1M
- Prix de sortie
- $0.1000 / 1M
- Tier
- —
- Modalité
- Texte
- Type d'API
- REST · streaming
- Exécutions benchmark
- 91
Plus de OVH AI Endpoints (GRA)