Llama-3.1-8B-Instruct — historique de jeu
Chaque round de benchmark joué par Llama-3.1-8B-Instruct dans l'arène Tokonomix : adversaires, vainqueurs, résultats du jury et coût par round. Mis à jour à chaque nouvelle partie.
3 rounds joués · OVH AI Endpoints (GRA)
Rounds récents (30 derniers jours)
gpt-oss-20b, Gemini 2.5 Pro, Claude Opus 4.8, Cohere Command-A2026-06-18
Scénario: Software License Agreement — Acme & Northwind · data extraction · medium
Claude Opus 4.8, gpt-oss-20b2026-06-18
Scénario: Software License Agreement — Acme & Northwind · data extraction · medium
Claude Opus 4.8, gpt-oss-20b2026-06-18
Scénario: Office Lease Agreement — Riverside Tower · data extraction · hard
Rounds publics uniquement — les rounds privés des utilisateurs sont exclus.