Arena diaria
Repetición de la partida
Reproduciendo una partida guardada: no se llama a ningún modelo.
Veredicto final — coste, calidad y ventaja
| Jugadores | Coste | Calidad | Victorias | Ventaja / estado |
|---|---|---|---|---|
| gpt-4.1 | €0.0047 | 80.67 | 2 | 100 HP |
| Gemini 2.5 Pro | €0.0089 | 81.33 | 1 | 79 HP |
| gpt-4o-mini | €0.0003 | 76.33 | 0 | 61 HP |
Límite de honestidad
La ventaja empieza en 100; cada turno el modelo activo más débil pierde el daño derivado — daño = 16 + 24·margen, margen = (ganador − segundo) ÷ escala de puntuación (deriveRoundOutcomes v8.1-tokonomix).
Un empate exacto no tiene ganador decisivo — sin disparo, sin daño ese turno.
0 de ventaja NO es eliminación: cada modelo responde en cada turno. El ganador real es el panel del jurado de abajo, mostrado para todos los modelos.
El daño refleja la diferencia relativa entre las mejores puntuaciones, no la calidad absoluta — ganar un turno bajo vale lo mismo que uno alto.
La escala es la puntuación de turno más alta de esta repetición (0–10 o 0–100); un turno alto puede hacer que los demás parezcan más cerca.