Günlük Arena

Maç tekrarı

Kaydedilmiş bir maç oynatılıyor — hiçbir model çağrılmıyor.

⚖ Çok-jürili konsensüs — markamız

Tokonomix multi-council + jüri + kör nokta tespiti — daha düşük maliyet, tek modelin kaçırdığı hataları yakalar.

Multi-council · daha düşük maliyetÇok-jüri · cross-familyKör nokta tespiti · kaçan hatayı yakalaN-team · gruplar karşı karşıya

Oyun türü

Tur: 10

Hız1×

customer_service · roundTur 0 / 10

Kalitede geri kalmayan en ucuz model burada görünür.

0 / 10

Claude Opus 4.7

Anthropic

€—puan —

100

gpt-5.5

OpenAI

€—puan —

100

DeepSeek v3.2

OpenRouter

€—puan —

100

Llama 3.3 70B Instruct

OpenRouter

€—puan —

100

Llama 4 Scout

OpenRouter

€—puan —

100

Nous Hermes 3 70B

OpenRouter

€—puan —

100

Müşteri

Başlamak için “Sonraki tur”a basın.

Nihai karar — maliyet, kalite ve avantaj

Oyuncular	Maliyet	Kalite	Galibiyet	Avantaj / durum
Claude Opus 4.7	€0.2375	65	0	tükendi
gpt-5.5	€0.1857	68	6	tükendi
DeepSeek v3.2	€0.0065	58.5	1	tükendi
Llama 3.3 70B Instruct	€0.0025	72.5	0	tükendi
Llama 4 Scout	€0.0020	72.5	0	100 HP
Nous Hermes 3 70B	€0.0082	2.5	0	tükendi

0 / 10Drone hasarı = jüri çoğunluğu gücü · HP = canlı avantaj · € = gerçek maliyet

Dürüstlük sınırı

Avantaj 100’den başlar. Elemeler jürinin nihai sıralamasını izler — en düşük sıradaki model önce düşer, son elemenin tur sonuna yakın gelmesi için ayarlanır. Jürinin galibi asla hedef alınmaz, bu yüzden her zaman ayakta kalan son model olur (deriveRoundOutcomes v9-elim-tokonomix).

Panel birincilik için gerçek bir beraberlikle biterse kimse elenmez ve her model sonuna kadar oynar.

0 avantaj, o modelin elendiği anlamına gelir; yalnızca galip kaldığında tekrar sonucu gösterir. Aşağıdaki jüri paneli, ayakta kalan o son modeli taçlandırır.

Avantaj çubuğu tur başına kaliteyi değil nihai sıralamayı görselleştirir — tur galibi rozeti ayrıca her turda en iyi kimin yanıtladığını işaretler.

Puan ölçeği bu tekrarda görülen en yüksek tur puanıdır (0–10 veya 0–100); yüksek bir tur diğerlerini daha yakın gösterebilir.

Sıfır model çağrısı — kaydedilen turun saf görüntüsü. Görünümü değiştirmek resmi değiştirir, sayıları asla.

Arenaya dön

Bu sonucu paylaş

X'te paylaş LinkedIn WhatsApp

↺ Yeni tur başlat