Dagelijkse arena
Wedstrijd-replay
Een opgeslagen wedstrijd wordt afgespeeld — er worden geen modellen aangeroepen.
Eindoordeel — kosten, kwaliteit & voorsprong
| Spelers | Kosten | Kwaliteit | Wins | Voorsprong / status |
|---|---|---|---|---|
| Claude Haiku 4.5 | €0.0029 | 71.8 | 0 | 100 HP |
| Gemini 2.5 Flash | €0.0015 | 65.2 | 0 | 100 HP |
| Gemini Pro Latest | €0.0099 | 6 | 0 | 100 HP |
| gpt-4.1 | €0.0029 | 64.8 | 0 | 100 HP |
| gpt-4o-2024-05-13 | €0.0080 | 66.4 | 0 | 100 HP |
| gpt-5.5-2026-04-23 | €0.0141 | 71.4 | 0 | 100 HP |
Eerlijkheids-grens
Voorsprong start op 100; elke beurt verliest het zwakste actieve model de afgeleide schade — schade = 16 + 24·marge, marge = (winnaar − nr. 2) ÷ scoreschaal (deriveRoundOutcomes v8.1-tokonomix).
Een exacte gelijkstand heeft geen beslissende winnaar — geen treffer, geen schade die beurt.
0 voorsprong is GEEN eliminatie: elk model beantwoordt elke beurt. De echte winnaar is het jurypanel onderaan, getoond voor álle modellen.
Schade weerspiegelt het relatieve gat tussen de topscores, niet de absolute kwaliteit — een lage beurt winnen geeft evenveel als een hoge.
De scoreschaal is de hoogste beurt-score in deze replay (0–10 of 0–100); één hoge beurt kan de rest dichter doen lijken.