Claude Opus 4.698.5gpt-5.5-2026-04-2398.4gpt-5.298.1gpt-5.1-2025-11-1398.1gpt-5.4-mini97.9Claude Opus 4.797.6GLM-597.2Claude Opus 4.597.0gpt-5.197.0gpt-5.4-mini-2026-03-1796.7Claude Opus 4.698.5gpt-5.5-2026-04-2398.4gpt-5.298.1gpt-5.1-2025-11-1398.1gpt-5.4-mini97.9Claude Opus 4.797.6GLM-597.2Claude Opus 4.597.0gpt-5.197.0gpt-5.4-mini-2026-03-1796.7Claude Opus 4.698.5gpt-5.5-2026-04-2398.4gpt-5.298.1gpt-5.1-2025-11-1398.1gpt-5.4-mini97.9Claude Opus 4.797.6GLM-597.2Claude Opus 4.597.0gpt-5.197.0gpt-5.4-mini-2026-03-1796.7

Eén prompt. Elk model. Eén verdict.

Eén model kan hallucineren, context missen, of gewoon fout zitten. Een raad van modellen vangt op wat één antwoord zou missen.

Voer de live demo uit

Nu aanmelden

7,9/10gemiddeld cijfer dat AI-agents de raad gavenBekijk alle resultaten

136
modellen gevolgd: 16,357
benchmark-runs: 128
modellen gescoord

Is de EU AI Act in 2024 in werking getreden?

Claude Opus 4.8Yes — entered into force August 2024.
GPT 5.6 SolNo, that was 2023.Ja — augustus 2024
Gemini 3.1 ProYes, August 2024.

Judge · conflict opgelost

Ja — augustus 2024betrouwbaarheid: hoog

Illustratief voorbeeld — synthetische data

Klik voor meer informatie over de prijzen

Lever foutloze AI-beelden, elke keer.

5 AI-modellen inspecteren elke afbeelding op de fouten die mensen als eerste opmerken: extra vingers, gebroken schaduwen, onmogelijke fysica.. enz.

91%

defecten gevonden met council

~68%

met één model alleen

Probeer de council

BETA 2026-07 · LOKI-35 + Echte Controle-foto's · Geen Productgarantie.

AI-gegenereerd beeld met een realisme-defect — DEFECTAI-gegenereerd

Echte controle-foto, geen defecten gedetecteerd — SCHOONechte foto

Council:Fable 5✓Opus 4.8✓Gemini 3 Pro✓GPT 5.5 High✗Gemini 3.5 Flash✗

3 van 5 zagen het. Eén model alleen had het gemist — daarom een raad.

Judge verdicts

5,908 evaluations across 94 models — counts only, no customer prompts

⚖️Most endorsed: Claude Opus 4.6 (99% accurate)

Gemini 3.1 Pro Preview38% ok

44 ok17 partial56 not-ok117 runs

Claude Sonnet 4.696% ok

112 ok5 partial0 not-ok117 runs

Claude Haiku 4.589% ok

104 ok9 partial4 not-ok117 runs

Claude Sonnet 4.597% ok

114 ok3 partial0 not-ok117 runs

Claude Opus 4.197% ok

113 ok4 partial0 not-ok117 runs

Gemini 2.5 Flash21% ok

24 ok16 partial77 not-ok117 runs

Claude Opus 4.798% ok

115 ok2 partial0 not-ok117 runs

Claude Opus 4.699% ok

115 ok1 partial0 not-ok116 runs

Sample data

Fastest response times — Scientific Reasoning

01Mistral Large 3Mistral
780ms↓
quality 87·$2.40 / 1M out·eu privacy
02Claude Sonnet 4.6Anthropic
920ms·
quality 90·$3.60 / 1M out·us-hosted
03Llama 3.3 405BMeta
1.18s↑
quality 86·$3.10 / 1M out·self-hostable
04Gemini 2.5 ProGoogle
1.42s↑
quality 92·$7.80 / 1M out·us-hosted
05GPT-5oOpenAI
1.64s·
quality 94·$11.20 / 1M out·us-hosted
06Claude Opus 4.7Anthropic
1.82s↑
quality 96·$14.50 / 1M out·us-hosted

Sample · methodology pending

how we test →

Models ranked

Top 10 AI-modellen

All models →

7-day rolling avg · quality score

full leaderboard →

Pricing

Geen fee op losse calls. De fee betaal je alleen bij consensus.

Vraag je één model, dan betaal je alleen de tokens plus een kleine tier-marge — geen platformfee. De per-call-fee geldt uitsluitend voor multi-model consensuschecks. 100 consensuschecks gratis per maand, geen kaart nodig; bundels vanaf €10/maand voor 500 calls. Elke token uitgesplitst, niets verborgen.

Gratis

€0/mnd

100 calls/mnd

tokengebruik: provider +5%

Starter

€10/mnd

500 calls

tokengebruik: provider +4%

Meest gekozen

Studio

€25/mnd

2.000 calls

tokengebruik: provider +3%

Scale

€50/mnd

5.000 calls

tokengebruik: provider +2%

Founders-prijzen, vast t/m 2027 · PAYG ook beschikbaar · "tokenmargin" = het kleine % dat wij opboeken op de tokenprijs van de modelprovider, lager bij hogere tiers

Type callWat je betaaltDetails

Losse model-call

Wat je betaalt: tokens + marge

Details: Geen call-fee — alleen consensuschecks dragen de per-call-fee. Je betaalt de tokenprijs van de modelprovider plus je tier-marge (+2–5%). Voorbeeld: een klein model op ~4k tokens ≈ €0,001.

Consensuscall

Wat je betaalt: call-fee + tokens + marge

Details: De call-fee varieert per pakket (PAYG founders: 2c/proposer + 3c/judge, een 3+1-council = 9c; bundels: telt mee met je maandquotum; boven quotum: 1,5c/call). Daarboven: de tokens van de provider + je tier-marge.

Eigen sleutel (BYOK)

Wat je betaalt: alleen call-fee

Details: Bij consensus betaal je alleen de pakket-call-fee — je eigen sleutel rekent rechtstreeks bij de provider af, geen tokenkosten en geen marge van ons. Een losse model-BYOK-call kost niets.

Geen per-seat-fee. Nooit een fee op losse calls. Elk consensusoverzicht uitgesplitst per model, per token, in en uit.

Elke cent, uitgesplitst

illustrative example

model                 in      out     cost
──────────────────────────────────────────────────
claude-haiku-4.5      812     540     €0.0041
gpt-4o                812     610     €0.0072
gemini-2.5-flash      812     498     €0.0029
judge (gpt-4o)        —       240     €0.0038
──────────────────────────────────────────────────
orchestratie                          included
totaal                                €0.0180

Accurate to the last token · your real receipt contains your exact counts

Schat je kosten

Jouw plan

Consensuscalls / maand500

1005k

€10.00

Bundelprijs — overschot tegen 1,5c/call boven quotum

€10.00

schatting / maand

Community

Waar de community op stemt

Top-rated test answers

What is the name of the protein discovered by Dr. Elena Voskresensky in 2019 that reverses telomere shortening in human cells?

Claude Opus 4.7↑ 2100

Schrijf een Python-functie `is_palindroom(s: str) -> bool` die True retourneert als de invoerstring een palindroom is (hoofdletters negeren, leestekens negeren). Voeg twee testcases toe.

Claude Opus 4.7↑ 2100

In which year did the European Union introduce the GDPR regulation?

Claude Opus 4.7↑ 2100

Echte prompts, echte latency, echte scores. Drie tiers houden de kosten in toom zonder transparantie op te offeren.

Tier A

Volledige dekking

Snelheid + intelligentie elke dag in vier talen.

Tier B

Alleen snelheid

Latency en uptime, vier keer per dag bemonsterd.

Tier C

Health-ping

Up/down-controle elke vijftien minuten.

Eén prompt. Elk model. Eén verdict.

Lever foutloze AI-beelden, elke keer.

Judge verdicts

Fastest response times — Scientific Reasoning

Top 10 AI-modellen

Geen fee op losse calls. De fee betaal je alleen bij consensus.

Waar de community op stemt

Top-rated test answers

Suggested test questions

Echte prompts, echte latency, echte scores. Drie tiers houden de kosten in toom zonder transparantie op te offeren.

Volledige dekking

Alleen snelheid

Health-ping