Arène quotidienne
Replay du match
Lecture d’un match enregistré — aucun modèle n’est appelé.
Verdict final — coût, qualité et avantage
| Joueurs | Coût | Qualité | Victoires | Avantage / statut |
|---|---|---|---|---|
| gpt-4.1 | €0.0040 | 70 | 0 | épuisé |
| Gemini 2.5 Pro | €0.0070 | 84.33 | 2 | 100 HP |
| gpt-4o-mini | €0.0002 | 77 | 0 | épuisé |
Limite d’honnêteté
L’avantage part de 100. Les éliminations suivent le classement final du jury — le modèle le moins bien classé tombe en premier, rythmé pour que le dernier K.-O. survienne vers la fin de la manche. Le gagnant du jury n’est jamais ciblé et reste donc toujours le dernier debout (deriveRoundOutcomes v9-elim-tokonomix).
Si le jury se termine sur une véritable égalité à la première place, personne n’est éliminé et chaque modèle joue jusqu’au bout.
0 d’avantage signifie que ce modèle est éliminé ; dès qu’il ne reste que le gagnant, la relecture affiche le résultat. Le jury ci-dessous couronne ce même modèle, le dernier debout.
La barre d’avantage visualise le classement final, pas la qualité par tour — le badge de vainqueur du tour marque séparément qui a le mieux répondu à chaque tour.
L’échelle de score est le score de tour le plus haut de cette rediffusion (0–10 ou 0–100) ; un tour élevé peut rapprocher les autres.