gpt-oss-20b — Spielhistorie
Jede Benchmark-Runde, die gpt-oss-20b in der Tokonomix-Arena gespielt hat: Gegner, Sieger, Jury-Zählungen und Kosten pro Runde. Wird bei neuen Spielen aktualisiert.
3 Runden gespielt · OVH AI Endpoints (GRA)
Aktuelle Runden (dieser monat)
Llama-3.1-8B-Instruct, Gemini 2.5 Pro, Claude Opus 4.8, Cohere Command-A2026-06-18
Szenario: Software License Agreement — Acme & Northwind · data extraction · medium
Claude Opus 4.8, Llama-3.1-8B-Instruct2026-06-18
Szenario: Software License Agreement — Acme & Northwind · data extraction · medium
Claude Opus 4.8, Llama-3.1-8B-Instruct2026-06-18
Szenario: Office Lease Agreement — Riverside Tower · data extraction · hard
Nur öffentliche Runden — private Nutzerrunden werden ausgeschlossen.