Aller au contenu

Arène quotidienne

Replay du match

Lecture d’un match enregistré — aucun modèle n’est appelé.

⚖ Consensus multi-juges — notre signature
Tokonomix multi-council + juge + détection des angles morts — coût réduit, rattrape les erreurs qu'un modèle manque.
Multi-council · coût réduitMulti-juges · cross-familyDétection des angles morts · rattrape l'erreur manquéeN-team · groupes face à face
Type de jeu
Tours: 3
Vitesse1×
customer_service · roundTour 0 / 3
Le modèle le moins cher qui tient la qualité apparaît ici.
0 / 3
gpt-4.1
OpenAI
GP
€—score
HP
100
Gemini 2.5 Pro
Google Gemini
GE
€—score
HP
100
gpt-4o-mini
OpenAI
GP
€—score
HP
100
Client
Appuyez sur « Tour suivant » pour commencer.

Verdict finalcoût, qualité et avantage

JoueursCoûtQualitéVictoiresAvantage / statut
gpt-4.1€0.0040700épuisé
Gemini 2.5 Pro€0.007084.332100 HP
gpt-4o-mini€0.0002770épuisé
0 / 3Dégâts du drone = force de la majorité du jury · HP = avantage en direct · € = coûts réels

Limite d’honnêteté

L’avantage part de 100. Les éliminations suivent le classement final du jury — le modèle le moins bien classé tombe en premier, rythmé pour que le dernier K.-O. survienne vers la fin de la manche. Le gagnant du jury n’est jamais ciblé et reste donc toujours le dernier debout (deriveRoundOutcomes v9-elim-tokonomix).

Si le jury se termine sur une véritable égalité à la première place, personne n’est éliminé et chaque modèle joue jusqu’au bout.

0 d’avantage signifie que ce modèle est éliminé ; dès qu’il ne reste que le gagnant, la relecture affiche le résultat. Le jury ci-dessous couronne ce même modèle, le dernier debout.

La barre d’avantage visualise le classement final, pas la qualité par tour — le badge de vainqueur du tour marque séparément qui a le mieux répondu à chaque tour.

L’échelle de score est le score de tour le plus haut de cette rediffusion (0–10 ou 0–100) ; un tour élevé peut rapprocher les autres.

Zéro appel de modèle — rendu pur du tour enregistré. Changer de vue change l’image, jamais les chiffres.
Retour à l’arène