Dagelijkse arena
Wedstrijd-replay
Een opgeslagen wedstrijd wordt afgespeeld — er worden geen modellen aangeroepen.
Eindoordeel — kosten, kwaliteit & voorsprong
| Spelers | Kosten | Kwaliteit | Wins | Voorsprong / status |
|---|---|---|---|---|
| gpt-5.5 | €0.0697 | 82 | 0 | 100 HP |
| Llama 3.3 70B Instruct | €0.0007 | 68 | 0 | 64 HP |
| Qwen 3.6 Plus | €0.0167 | 90 | 5 | 100 HP |
| DeepSeek v4 Pro | €0.0033 | 15 | 0 | 46 HP |
Eerlijkheids-grens
Voorsprong start op 100; elke beurt verliest het zwakste actieve model de afgeleide schade — schade = 16 + 24·marge, marge = (winnaar − nr. 2) ÷ scoreschaal (deriveRoundOutcomes v8.1-tokonomix).
Een exacte gelijkstand heeft geen beslissende winnaar — geen treffer, geen schade die beurt.
0 voorsprong is GEEN eliminatie: elk model beantwoordt elke beurt. De echte winnaar is het jurypanel onderaan, getoond voor álle modellen.
Schade weerspiegelt het relatieve gat tussen de topscores, niet de absolute kwaliteit — een lage beurt winnen geeft evenveel als een hoge.
De scoreschaal is de hoogste beurt-score in deze replay (0–10 of 0–100); één hoge beurt kan de rest dichter doen lijken.