Arène quotidienne
Replay du match
Lecture d’un match enregistré — aucun modèle n’est appelé.
Verdict final — coût, qualité et avantage
| Joueurs | Coût | Qualité | Victoires | Avantage / statut |
|---|---|---|---|---|
| Claude Opus 4.7 | €0.2375 | 65 | 0 | 100 HP |
| gpt-5.5 | €0.1857 | 68 | 6 | 100 HP |
| DeepSeek v3.2 | €0.0065 | 58.5 | 1 | 100 HP |
| Llama 3.3 70B Instruct | €0.0025 | 72.5 | 0 | 100 HP |
| Llama 4 Scout | €0.0020 | 72.5 | 0 | 82 HP |
| Nous Hermes 3 70B | €0.0082 | 2.5 | 0 | épuisé |
Limite d’honnêteté
L’avantage part de 100 ; à chaque tour le modèle actif le plus faible perd les dégâts dérivés — dégâts = 16 + 24·marge, marge = (gagnant − deuxième) ÷ échelle de score (deriveRoundOutcomes v8.1-tokonomix).
Une égalité exacte n’a pas de vainqueur décisif — pas de tir, pas de dégâts ce tour.
0 avantage n’est PAS une élimination : chaque modèle répond à chaque tour. Le vrai gagnant est le jury ci-dessous, affiché pour tous les modèles.
Les dégâts reflètent l’écart relatif entre les meilleurs scores, pas la qualité absolue — gagner un tour faible vaut autant qu’un tour fort.
L’échelle de score est le score de tour le plus haut de cette rediffusion (0–10 ou 0–100) ; un tour élevé peut rapprocher les autres.