Günlük Arena
Maç tekrarı
Kaydedilmiş bir maç oynatılıyor — hiçbir model çağrılmıyor.
Nihai karar — maliyet, kalite ve avantaj
| Oyuncular | Maliyet | Kalite | Galibiyet | Avantaj / durum |
|---|---|---|---|---|
| Claude Opus 4.7 | €0.2375 | 65 | 0 | 100 HP |
| gpt-5.5 | €0.1857 | 68 | 6 | 100 HP |
| DeepSeek v3.2 | €0.0065 | 58.5 | 1 | 100 HP |
| Llama 3.3 70B Instruct | €0.0025 | 72.5 | 0 | 100 HP |
| Llama 4 Scout | €0.0020 | 72.5 | 0 | 82 HP |
| Nous Hermes 3 70B | €0.0082 | 2.5 | 0 | tükendi |
Dürüstlük sınırı
Avantaj 100’den başlar; her tur en zayıf aktif model türetilen hasarı kaybeder — hasar = 16 + 24·fark, fark = (galip − ikinci) ÷ puan ölçeği (deriveRoundOutcomes v8.1-tokonomix).
Tam beraberlikte kesin galip yoktur — o turda atış ve hasar olmaz.
0 avantaj eleme DEĞİLDİR: her model her turda yanıt verir. Gerçek galip, tüm modeller için gösterilen aşağıdaki jüri panelidir.
Hasar, mutlak kaliteyi değil en yüksek puanlar arasındaki göreli farkı yansıtır — düşük puanlı bir turu kazanmak yüksek puanlı kadar değerlidir.
Puan ölçeği bu tekrarda görülen en yüksek tur puanıdır (0–10 veya 0–100); yüksek bir tur diğerlerini daha yakın gösterebilir.