Breng de fout aan het licht die één model mist.
Eén prompt gaat parallel naar de beste modellen. Een neutrale judge van een ander lab signaleert waar ze het oneens zijn — en bundelt ze tot één verdedigbaar antwoord. EU-gehost, volledig traceerbaar.
Verminder de fouten die één model zou missen.
- 131
- modellen gevolgd
- 13,593
- benchmark-runs
- 6
- talen
Is de EU AI Act in 2024 in werking getreden?
- claude-opus-4.8Yes — entered into force August 2024.
- gpt-5.1No, that was 2023.
- gemini-3-proYes, August 2024.
Illustratief voorbeeld — synthetische data
5 AI-modellen inspecteren je beeld — vóór je publiek het doet.
Beeld-consensus: een raad van vijf vision-modellen vangt anatomie-, fysica- en licht-fouten in AI-beelden die één model mist.
Meer over image-consensus →
Pilot 2026-06 · LOKI-35 + echte controle-foto's · geen productgarantie.
3 van 5 zagen het. Eén model alleen had het gemist — daarom een raad.
Live rankings
Top modellen deze week
Sample data
Top models — Scientific Reasoning
01Mistral Large 3Mistral
780ms↓
02Claude Sonnet 4.6Anthropic
920ms·
03Llama 3.3 405BMeta
1.18s↑
04Gemini 2.5 ProGoogle
1.42s↑
05GPT-5oOpenAI
1.64s·
06Claude Opus 4.7Anthropic
1.82s↑
Sample · methodology pending
how we test →Judge verdicts
3,735 evaluations across 63 models — counts only, no customer prompts
Claude Fable 5 — intelligentietest
Onafhankelijke, door een jury beoordeelde resultaten over onze taakcategorieën — uit echte testruns, doorlopend ververst.
Score per taakcategorie
Mediane reactietijd
Elk antwoord krijgt 0–100 van een onafhankelijk jurymodel op feitelijkheid, volledigheid, redenering en vorm. Lagere feitelijkheidsscores komen door onze bewust moeilijke kennisvragen.
Release-notes →Zie waar de modellen uit elkaar lopen.
In onze wekelijkse intelligentietests beoordeelt een neutrale judge elk model. Dit zijn de vragen waarover de modellen het meest van mening verschilden — de blinde vlekken die één model verborgen zou hebben gehouden. Geanonimiseerd; er worden nooit klantprompts getoond.
Models ranked
Top 10 AI-modellen
Anthropic
Claude Opus 4.5
99.2
quality score
6,978
ms p50
Anthropic
Claude Opus 4.7
99.2
quality score
8,347
ms p50
Anthropic
Claude Opus 4.6
98.7
quality score
8,280
ms p50
Anthropic
Claude Opus 4.8
98.6
quality score
6,696
ms p50
OpenAI
gpt-4.1
98.4
quality score
1,711
ms p50
Anthropic
Claude Sonnet 4.6
97.9
quality score
7,490
ms p50
Anthropic
Claude Sonnet 4.5
95.9
quality score
6,728
ms p50
Anthropic
Claude Haiku 4.5
95.7
quality score
3,326
ms p50
Google Gemini
Gemini 2.5 Flash-Lite
94.7
quality score
1,572
ms p50
Google Gemini
Gemini Flash Latest
53.3
quality score
4,366
ms p50
Geen fee op losse calls. De fee betaal je alleen bij consensus.
Vraag je één model, dan betaal je alleen de tokens plus een kleine tier-marge — geen platformfee. De per-call-fee geldt uitsluitend voor multi-model consensuschecks. 100 consensuschecks gratis per maand, geen kaart nodig; bundels vanaf €10/maand voor 500 calls. Elke token uitgesplitst, niets verborgen.
Gratis
€0/mnd
100 calls/mnd
tokengebruik: provider +5%
Starter
€10/mnd
500 calls
tokengebruik: provider +4%
Studio
€25/mnd
2.000 calls
tokengebruik: provider +3%
Scale
€50/mnd
5.000 calls
tokengebruik: provider +2%
Founders-prijzen, vast t/m 2027 · PAYG ook beschikbaar · "tokenmargin" = het kleine % dat wij opboeken op de tokenprijs van de modelprovider, lager bij hogere tiers
Geen per-seat-fee. Nooit een fee op losse calls. Elk consensusoverzicht uitgesplitst per model, per token, in en uit.
Elke cent, uitgesplitst
illustrative examplemodel in out cost ────────────────────────────────────────────────── claude-haiku-4.5 812 540 €0.0041 gpt-4o 812 610 €0.0072 gemini-2.5-flash 812 498 €0.0029 judge (gpt-4o) — 240 €0.0038 ────────────────────────────────────────────────── orchestratie included totaal €0.0180
Accurate to the last token · your real receipt contains your exact counts
Schat je kosten
€10.00
Bundelprijs — overschot tegen 1,5c/call boven quotum
€10.00
schatting / maand
Community
Waar de community op stemt
Top-rated test answers
Schrijf een Python-functie `is_palindroom(s: str) -> bool` die True retourneert als de invoerstring een palindroom is (hoofdletters negeren, leestekens negeren). Voeg twee testcases toe.
What is the name of the protein discovered by Dr. Elena Voskresensky in 2019 that reverses telomere shortening in human cells?
In which year did the European Union introduce the GDPR regulation?
Suggested test questions
No suggestions yet.
Run a test and suggest a question →Zo testen we
Echte prompts, echte latency, echte scores. Drie tiers houden de kosten in toom zonder transparantie op te offeren.
Volledige dekking
Snelheid + intelligentie elke dag in vier talen.
Alleen snelheid
Latency en uptime, vier keer per dag bemonsterd.
Health-ping
Up/down-controle elke vijftien minuten.
Probeer elk model — hier ter plekke
Kies een model, typ een prompt, zie het antwoord live verschijnen. Geen aanmelden, geen creditcard, geen context-switch.
Open de live tester →