Arena diaria
Repetición de la partida
Reproduciendo una partida guardada: no se llama a ningún modelo.
Veredicto final — coste, calidad y ventaja
| Jugadores | Coste | Calidad | Victorias | Ventaja / estado |
|---|---|---|---|---|
| Claude Fable 5 | €2.0291 | 68.75 | 5 | agotado |
| Gemini 3.5 Flash | €0.1300 | 20 | 0 | agotado |
| gpt-5-chat-latest | €0.0956 | 93.75 | 20 | 100 HP |
Límite de honestidad
La ventaja empieza en 100. Las eliminaciones siguen la clasificación final del jurado — el modelo peor clasificado cae primero, con un ritmo para que la última eliminación llegue cerca del final de la ronda. El ganador del jurado nunca es objetivo, así que siempre queda el último en pie (deriveRoundOutcomes v9-elim-tokonomix).
Si el panel termina en un empate real por el primer puesto, nadie es eliminado y cada modelo juega hasta el final.
0 de ventaja significa que ese modelo queda eliminado; en cuanto solo queda el ganador, la repetición muestra el resultado. El panel del jurado de abajo corona a ese mismo modelo, el último en pie.
La barra de ventaja visualiza la clasificación final, no la calidad por turno — la insignia de ganador del turno marca por separado quién respondió mejor en cada turno.
La escala es la puntuación de turno más alta de esta repetición (0–10 o 0–100); un turno alto puede hacer que los demás parezcan más cerca.