Günlük Arena
Maç tekrarı
Kaydedilmiş bir maç oynatılıyor — hiçbir model çağrılmıyor.
Nihai karar — maliyet, kalite ve avantaj
| Oyuncular | Maliyet | Kalite | Galibiyet | Avantaj / durum |
|---|---|---|---|---|
| gpt-5.5 | €0.0697 | 82 | 0 | 100 HP |
| Llama 3.3 70B Instruct | €0.0007 | 68 | 0 | 64 HP |
| Qwen 3.6 Plus | €0.0167 | 90 | 5 | 100 HP |
| DeepSeek v4 Pro | €0.0033 | 15 | 0 | 46 HP |
Dürüstlük sınırı
Avantaj 100’den başlar; her tur en zayıf aktif model türetilen hasarı kaybeder — hasar = 16 + 24·fark, fark = (galip − ikinci) ÷ puan ölçeği (deriveRoundOutcomes v8.1-tokonomix).
Tam beraberlikte kesin galip yoktur — o turda atış ve hasar olmaz.
0 avantaj eleme DEĞİLDİR: her model her turda yanıt verir. Gerçek galip, tüm modeller için gösterilen aşağıdaki jüri panelidir.
Hasar, mutlak kaliteyi değil en yüksek puanlar arasındaki göreli farkı yansıtır — düşük puanlı bir turu kazanmak yüksek puanlı kadar değerlidir.
Puan ölçeği bu tekrarda görülen en yüksek tur puanıdır (0–10 veya 0–100); yüksek bir tur diğerlerini daha yakın gösterebilir.