Tägliche Arena
Match-Replay
Ein gespeichertes Match wird abgespielt — es werden keine Modelle aufgerufen.
Endurteil — Kosten, Qualität & Vorsprung
| Spieler | Kosten | Qualität | Siege | Vorsprung / Status |
|---|---|---|---|---|
| Claude Opus 4.7 | €0.2375 | 65 | 0 | 100 HP |
| gpt-5.5 | €0.1857 | 68 | 6 | 100 HP |
| DeepSeek v3.2 | €0.0065 | 58.5 | 1 | 100 HP |
| Llama 3.3 70B Instruct | €0.0025 | 72.5 | 0 | 100 HP |
| Llama 4 Scout | €0.0020 | 72.5 | 0 | 82 HP |
| Nous Hermes 3 70B | €0.0082 | 2.5 | 0 | erschöpft |
Ehrlichkeitsgrenze
Vorsprung beginnt bei 100; jede Runde verliert das schwächste aktive Modell den abgeleiteten Schaden — Schaden = 16 + 24·Marge, Marge = (Sieger − Zweiter) ÷ Punkteskala (deriveRoundOutcomes v8.1-tokonomix).
Ein exakter Gleichstand hat keinen klaren Sieger — kein Treffer, kein Schaden in dieser Runde.
0 Vorsprung ist KEINE Eliminierung: jedes Modell antwortet in jeder Runde. Der echte Sieger ist das Jury-Panel unten, für alle Modelle gezeigt.
Schaden zeigt den relativen Abstand der Topwerte, nicht die absolute Qualität — eine schwache Runde zu gewinnen zählt gleich wie eine starke.
Die Punkteskala ist der höchste Rundenwert dieser Replay (0–10 oder 0–100); ein hoher Wert kann die anderen näher wirken lassen.