Claude Opus 4.698.5gpt-5.5-2026-04-2398.4gpt-5.298.1gpt-5.1-2025-11-1398.1gpt-5.4-mini97.9Claude Opus 4.797.6GLM-597.2Claude Opus 4.597.0gpt-5.197.0gpt-5.4-mini-2026-03-1796.7Claude Opus 4.698.5gpt-5.5-2026-04-2398.4gpt-5.298.1gpt-5.1-2025-11-1398.1gpt-5.4-mini97.9Claude Opus 4.797.6GLM-597.2Claude Opus 4.597.0gpt-5.197.0gpt-5.4-mini-2026-03-1796.7Claude Opus 4.698.5gpt-5.5-2026-04-2398.4gpt-5.298.1gpt-5.1-2025-11-1398.1gpt-5.4-mini97.9Claude Opus 4.797.6GLM-597.2Claude Opus 4.597.0gpt-5.197.0gpt-5.4-mini-2026-03-1796.7

Ein Prompt. Jedes Modell. Ein Urteil.

Ein Modell kann halluzinieren, Kontext übersehen oder einfach falsch liegen. Ein Rat aus mehreren Modellen erkennt, was eine einzelne Antwort übersehen würde.

Live-Demo starten

Jetzt registrieren

7,9/10Durchschnittsnote, die KI-Agenten dem Rat gabenAlle Ergebnisse ansehen

136
verfolgte Modelle: 16,357
Benchmark-Läufe: 128
bewertete Modelle

Ist der EU AI Act im Jahr 2024 in Kraft getreten?

Claude Opus 4.8Yes — entered into force August 2024.
GPT 5.6 SolNo, that was 2023.Ja — August 2024
Gemini 3.1 ProYes, August 2024.

Judge · Konflikt aufgelöst

Ja — August 2024Konfidenz: hoch

Illustratives Beispiel — synthetische Daten

Klicken Sie hier für weitere Informationen zu den Preisen

Liefern Sie makellose KI-Bilder, jedes Mal.

5 KI-Modelle prüfen jedes Bild auf die Fehler, die Menschen zuerst bemerken: zusätzliche Finger, gebrochene Schatten, unmögliche Physik.. usw.

91%

Defekte erkannt mit Rat

~68%

Mit einem Modell allein

Rat testen

BETA 2026-07 · LOKI-35 + Echte Kontrollfotos · Keine Produktgarantie.

KI-generiertes Bild mit einem Realismus-Defekt — DEFEKTKI-generiert

Echtes Kontrollfoto, keine Defekte erkannt — SAUBERechtes Foto

Rat:Fable 5✓Opus 4.8✓Gemini 3 Pro✓GPT 5.5 High✗Gemini 3.5 Flash✗

3 von 5 haben es gesehen. Ein Modell allein hätte es übersehen — darum ein Rat.

Judge verdicts

5,908 evaluations across 94 models — counts only, no customer prompts

⚖️Most endorsed: Claude Opus 4.6 (99% accurate)

Gemini 3.1 Pro Preview38% ok

44 ok17 partial56 not-ok117 runs

Claude Sonnet 4.696% ok

112 ok5 partial0 not-ok117 runs

Claude Haiku 4.589% ok

104 ok9 partial4 not-ok117 runs

Claude Sonnet 4.597% ok

114 ok3 partial0 not-ok117 runs

Claude Opus 4.197% ok

113 ok4 partial0 not-ok117 runs

Gemini 2.5 Flash21% ok

24 ok16 partial77 not-ok117 runs

Claude Opus 4.798% ok

115 ok2 partial0 not-ok117 runs

Claude Opus 4.699% ok

115 ok1 partial0 not-ok116 runs

Sample data

Fastest response times — Scientific Reasoning

01Mistral Large 3Mistral
780ms↓
quality 87·$2.40 / 1M out·eu privacy
02Claude Sonnet 4.6Anthropic
920ms·
quality 90·$3.60 / 1M out·us-hosted
03Llama 3.3 405BMeta
1.18s↑
quality 86·$3.10 / 1M out·self-hostable
04Gemini 2.5 ProGoogle
1.42s↑
quality 92·$7.80 / 1M out·us-hosted
05GPT-5oOpenAI
1.64s·
quality 94·$11.20 / 1M out·us-hosted
06Claude Opus 4.7Anthropic
1.82s↑
quality 96·$14.50 / 1M out·us-hosted

Sample · methodology pending

how we test →

Models ranked

Top 10 KI-Modelle

All models →

7-day rolling avg · quality score

full leaderboard →

Pricing

Keine Gebühr auf einzelne Anfragen. Die Gebühr fällt nur bei Konsensus an.

Fragen Sie ein einzelnes Modell, zahlen Sie nur die Token plus eine kleine Tier-Marge — keine Plattformgebühr. Die Pro-Call-Gebühr gilt ausschließlich für Multi-Modell-Konsensus-Prüfungen. 100 Konsensus-Prüfungen pro Monat kostenlos, keine Kreditkarte nötig; Pakete ab €10/Monat für 500 Anfragen. Jeder Token aufgelistet, nichts versteckt.

Kostenlos

€0/Monat

100 Anfragen/Monat

Token-Nutzung: Anbieter +5 %

Starter

€10/Monat

500 Anfragen

Token-Nutzung: Anbieter +4 %

Am beliebtesten

Studio

€25/Monat

2.000 Anfragen

Token-Nutzung: Anbieter +3 %

Scale

€50/Monat

5.000 Anfragen

Token-Nutzung: Anbieter +2 %

Gründerpreise, fest bis Ende 2027 · PAYG ebenfalls verfügbar · "Token-Marge" = der kleine %-Aufschlag auf den Token-Preis des Anbieters, geringer bei höheren Tarifen

AnfragetypWas Sie zahlenDetails

Einzelne Modellanfrage

Was Sie zahlen: Token + Marge

Details: Keine Anfrage-Gebühr — nur Konsensus-Prüfungen tragen die Pro-Call-Gebühr. Sie zahlen den Token-Preis des Modellanbieters plus Ihre Tier-Marge (+2–5 %). Beispiel: kleines Modell auf ~4k Token ≈ €0,001.

Konsensus-Anfrage

Was Sie zahlen: Anfrage-Gebühr + Token + Marge

Details: Die Gebühr variiert je nach Paket (PAYG Gründerpreis: 2 Ct/Proposer + 3 Ct/Judge, ein 3+1-Council = 9 Ct; Pakete: zählt gegen Ihr Monatskontingent; über Kontingent: 1,5 Ct/Call). Dazu: Token des Anbieters + Ihre Tier-Marge.

Eigenen API-Schlüssel mitbringen (BYOK)

Was Sie zahlen: nur Anfrage-Gebühr

Details: Bei Konsensus zahlen Sie nur die paketspezifische Gebühr — Ihr eigener Schlüssel rechnet direkt mit dem Anbieter ab, keine Token-Kosten und keine Marge von uns. Eine einzelne BYOK-Anfrage kostet nichts.

Keine Lizenzgebühr. Keine Gebühr auf einzelne Anfragen. Jede Konsensus-Abrechnung aufgelistet — pro Modell, pro Token, ein- und ausgehend.

Jeder Cent aufgelistet

illustrative example

model                 in      out     cost
──────────────────────────────────────────────────
claude-haiku-4.5      812     540     €0.0041
gpt-4o                812     610     €0.0072
gemini-2.5-flash      812     498     €0.0029
judge (gpt-4o)        —       240     €0.0038
──────────────────────────────────────────────────
Orchestrierung                        included
Gesamt                                €0.0180

Accurate to the last token · your real receipt contains your exact counts

Kosten schätzen

Ihr Tarif

Konsensus-Anfragen / Monat500

1005k

€10.00

Paketpreis — Überschreitung zu 1,5 Ct/Call über Kontingent

€10.00

Schätzung / Monat

Community

Worüber die Community abstimmt

Top-rated test answers

What is the name of the protein discovered by Dr. Elena Voskresensky in 2019 that reverses telomere shortening in human cells?

Claude Opus 4.7↑ 2100

Schrijf een Python-functie `is_palindroom(s: str) -> bool` die True retourneert als de invoerstring een palindroom is (hoofdletters negeren, leestekens negeren). Voeg twee testcases toe.

Claude Opus 4.7↑ 2100

In which year did the European Union introduce the GDPR regulation?

Claude Opus 4.7↑ 2100

Echte Prompts, echte Latenz, echte Bewertungen. Drei Tiers halten die Kosten im Griff, ohne die Transparenz zu opfern.

Tier A

Volle Abdeckung

Geschwindigkeit + Intelligenz täglich in vier Sprachen.

Tier B

Nur Geschwindigkeit

Latenz und Verfügbarkeit, viermal täglich erhoben.

Tier C

Health-Ping

Up/Down-Prüfung alle fünfzehn Minuten.

Ein Prompt. Jedes Modell. Ein Urteil.

Liefern Sie makellose KI-Bilder, jedes Mal.

Judge verdicts

Fastest response times — Scientific Reasoning

Top 10 KI-Modelle

Keine Gebühr auf einzelne Anfragen. Die Gebühr fällt nur bei Konsensus an.

Worüber die Community abstimmt

Top-rated test answers

Suggested test questions

Echte Prompts, echte Latenz, echte Bewertungen. Drei Tiers halten die Kosten im Griff, ohne die Transparenz zu opfern.

Volle Abdeckung

Nur Geschwindigkeit

Health-Ping