Llama-3.1-8B-Instruct games — junio 2026
Cada ronda de benchmark que Llama-3.1-8B-Instruct jugó en la arena Tokonomix: oponentes, ganadores, conteos del jurado y costo por ronda. Actualizado cuando se juegan nuevas partidas.
3 rondas jugadas · OVH AI Endpoints (GRA)
Rondas recientes (últimos 30 días)
gpt-oss-20b, Gemini 2.5 Pro, Claude Opus 4.8, Cohere Command-A2026-06-18
Escenario: Software License Agreement — Acme & Northwind · data extraction · medium
Claude Opus 4.8, gpt-oss-20b2026-06-18
Escenario: Software License Agreement — Acme & Northwind · data extraction · medium
Claude Opus 4.8, gpt-oss-20b2026-06-18
Escenario: Office Lease Agreement — Riverside Tower · data extraction · hard
Solo rondas públicas — las rondas privadas de usuarios están excluidas.