Günlük Arena
Maç tekrarı
Kaydedilmiş bir maç oynatılıyor — hiçbir model çağrılmıyor.
Nihai karar — maliyet, kalite ve avantaj
| Oyuncular | Maliyet | Kalite | Galibiyet | Avantaj / durum |
|---|---|---|---|---|
| Claude Haiku 4.5 | €0.0029 | 71.8 | 0 | 100 HP |
| Gemini 2.5 Flash | €0.0015 | 65.2 | 0 | 100 HP |
| Gemini Pro Latest | €0.0099 | 6 | 0 | 100 HP |
| gpt-4.1 | €0.0029 | 64.8 | 0 | 100 HP |
| gpt-4o-2024-05-13 | €0.0080 | 66.4 | 0 | 100 HP |
| gpt-5.5-2026-04-23 | €0.0141 | 71.4 | 0 | 100 HP |
Dürüstlük sınırı
Avantaj 100’den başlar; her tur en zayıf aktif model türetilen hasarı kaybeder — hasar = 16 + 24·fark, fark = (galip − ikinci) ÷ puan ölçeği (deriveRoundOutcomes v8.1-tokonomix).
Tam beraberlikte kesin galip yoktur — o turda atış ve hasar olmaz.
0 avantaj eleme DEĞİLDİR: her model her turda yanıt verir. Gerçek galip, tüm modeller için gösterilen aşağıdaki jüri panelidir.
Hasar, mutlak kaliteyi değil en yüksek puanlar arasındaki göreli farkı yansıtır — düşük puanlı bir turu kazanmak yüksek puanlı kadar değerlidir.
Puan ölçeği bu tekrarda görülen en yüksek tur puanıdır (0–10 veya 0–100); yüksek bir tur diğerlerini daha yakın gösterebilir.