Ir al contenido

Game Scoreboard mes pasado

Todo lo que recogen los juegos en un solo tablero — tasas de victoria, votos del jurado, integridad del jurado, detección de puntos ciegos, valor council-vs-frontier y un campeón por capacidad. Todas las cifras se calculan en vivo de rondas reales.

Un análisis más profundo que la franja de rondas recientes. Elige una ventana temporal abajo; cada ventana tiene su propia URL.

Partidas recientes

0
juegos jugados
0
modelos en la arena
0
evaluaciones del jurado
0
votos de usuario cara a cara
🔍
puntos ciegos detectados por el jurado (nuestra métrica distintiva · en despliegue)
Aún no hay juegos en esta ventana — juega uno en la arena y aparecerá aquí.

Mejores modelos — rendimiento de juego tasa de victoria en todas las rondas de la ventana

Calculado en vivo de rondas: juegos, victorias/derrotas, votos del jurado, rondas-como-juez. live

#ModeloJuegosV–DTasa victoriaJurado ▲Como juez
▲ tasa de victoriajurado ▲ = jueces del panel que respaldaron este modelo — haz clic para ver cuálescomo-juez = rondas en las que puntuó a otros

Campeón por capacidad Mes pasado

Modelo con mayor tasa de victoria que tiene cada capacidad y jugó en la ventana. live

🧠 razonamiento
aún sin rondas
uso de herramientas
aún sin rondas
👁 visión
aún sin rondas
📋 json-schema
aún sin rondas
🎧 audio
aún sin rondas

Tablero de integridad del jurado el volante — quién puntúa en línea con el panel

Por modelo juez: evaluaciones emitidas y con qué frecuencia su elección coincidió con el ganador de la ronda. live

JuezEval.Coincidencia
Aún no hay juegos en esta ventana — juega uno en la arena y aparecerá aquí.
Coincidencia = proporción de elecciones de este juez que coincidieron con el ganador electo de la ronda.

Votos de usuario y juego

Cómo votaron el panel y los humanos.

Votos de juego (panel) emitidos0live
Upvotes ▲ comunidad33histórico
Votos de usuario cara a cara0en vivo · esperando tráfico
Votos "modelo deseado"live
Fuentes: judge_panel · model_arena_activity.upvotes_received · votes · wanted_votes

🔍 Puntos ciegos detectados por el jurado — nuestra métrica de marca, ningún otro tablero la tiene

La cifra distintiva de Tokonomix: por modelo, cuántos puntos ciegos atrapó vs creó el jurado — confirmado solo cuando ≥2 jueces del panel coinciden en que es una omisión real. en despliegue — Fase C

Una métrica distintiva de Tokonomix — ningún otro tablero la muestra. Aparece cuando la arena emite puntos ciegos (opt-in, nunca en juegos públicos — limitado por coste).

Council vs Frontier ¿más barato Y/O más inteligente?

Equipos consenso de modelos baratos vs un único frontier premium — tasa de victoria y € ahorrados. live

Aún no hay rondas council-vs-frontier en esta ventana.
La narrativa central de Tokonomix, cuantificada por duelo. El coste es dispatch-only (sobrecarga del jurado excluida).

💶 Coste: gastado vs ahorrado lo que vale la historia del consenso, en €

Total € gastado en juegos en esta ventana, y € ahorrados cuando un council más barato igualó o venció a un frontier premium. live

€0.000
gasto total de juego (ventana)
€0.000
ahorrado vs siempre-frontier (solo coste de concursantes)
recorte medio cuando council ganó/empató
Regla de cálculo: En juegos council el panel de jurado es sobrecarga neutral — cuesta lo mismo sin importar quién juegue, así que NO cuenta para "ahorrado". Ahorro = coste concursante frontier − coste concursante council; per_player_cost es dispatch-only.

Historial de juego por modelo haz clic en un modelo → su historial completo

Cada nombre de modelo enlaza a su página; un historial de juego por modelo, filtrado por tiempo (cada ronda jugada, con resúmenes) está en despliegue — una página fresca, enlazada internamente, que crece con los juegos.

Todo lo marcado live viene de rondas reales ahora; las métricas en despliegue llegan con la Fase C.
Volver a la arena