Dagelijkse arena
Wedstrijd-replay
Een opgeslagen wedstrijd wordt afgespeeld — er worden geen modellen aangeroepen.
Eindoordeel — kosten, kwaliteit & voorsprong
| Spelers | Kosten | Kwaliteit | Wins | Voorsprong / status |
|---|---|---|---|---|
| Claude Opus 4.7 | €0.2375 | 65 | 0 | 100 HP |
| gpt-5.5 | €0.1857 | 68 | 6 | 100 HP |
| DeepSeek v3.2 | €0.0065 | 58.5 | 1 | 100 HP |
| Llama 3.3 70B Instruct | €0.0025 | 72.5 | 0 | 100 HP |
| Llama 4 Scout | €0.0020 | 72.5 | 0 | 82 HP |
| Nous Hermes 3 70B | €0.0082 | 2.5 | 0 | uitgeput |
Eerlijkheids-grens
Voorsprong start op 100; elke beurt verliest het zwakste actieve model de afgeleide schade — schade = 16 + 24·marge, marge = (winnaar − nr. 2) ÷ scoreschaal (deriveRoundOutcomes v8.1-tokonomix).
Een exacte gelijkstand heeft geen beslissende winnaar — geen treffer, geen schade die beurt.
0 voorsprong is GEEN eliminatie: elk model beantwoordt elke beurt. De echte winnaar is het jurypanel onderaan, getoond voor álle modellen.
Schade weerspiegelt het relatieve gat tussen de topscores, niet de absolute kwaliteit — een lage beurt winnen geeft evenveel als een hoge.
De scoreschaal is de hoogste beurt-score in deze replay (0–10 of 0–100); één hoge beurt kan de rest dichter doen lijken.