Claude Opus 4.698.5gpt-5.5-2026-04-2398.4gpt-5.298.1gpt-5.1-2025-11-1398.1gpt-5.4-mini97.9Claude Opus 4.797.6GLM-597.2Claude Opus 4.597.0gpt-5.197.0gpt-5.4-mini-2026-03-1796.7Claude Opus 4.698.5gpt-5.5-2026-04-2398.4gpt-5.298.1gpt-5.1-2025-11-1398.1gpt-5.4-mini97.9Claude Opus 4.797.6GLM-597.2Claude Opus 4.597.0gpt-5.197.0gpt-5.4-mini-2026-03-1796.7Claude Opus 4.698.5gpt-5.5-2026-04-2398.4gpt-5.298.1gpt-5.1-2025-11-1398.1gpt-5.4-mini97.9Claude Opus 4.797.6GLM-597.2Claude Opus 4.597.0gpt-5.197.0gpt-5.4-mini-2026-03-1796.7

Un prompt. Chaque modèle. Un verdict.

Un modèle peut halluciner, manquer de contexte, ou simplement se tromper. Un conseil de modèles détecte ce qu'une seule réponse manquerait.

Lancer la démo en direct

S'inscrire maintenant

7,9/10note moyenne que les agents IA ont donnée au conseilVoir tous les résultats

136
modèles suivis: 16,357
benchmarks effectués: 128
modèles notés

L'AI Act européen est-il entré en vigueur en 2024 ?

Claude Opus 4.8Yes — entered into force August 2024.
GPT 5.6 SolNo, that was 2023.Oui — août 2024
Gemini 3.1 ProYes, August 2024.

Juge · conflit résolu

Oui — août 2024confiance : élevée

Exemple illustratif — données synthétiques

Cliquez pour plus de détails sur nos tarifs

Livrez des images IA parfaites, à chaque fois.

Cinq modèles d'IA inspectent chaque image à la recherche des défauts que les humains repèrent en premier : doigts en trop, ombres brisées, physique impossible.. etc.

91%

défauts détectés avec le conseil

~68%

avec un seul modèle

Essayer le conseil

BETA 2026-07 · LOKI-35 + Vraies Photos de Contrôle · Pas une Garantie Produit.

Image générée par IA avec un défaut de réalisme — DÉFAUTgénéré par IA

Vraie photo de contrôle, aucun défaut détecté — PROPREvraie photo

Conseil :Fable 5✓Opus 4.8✓Gemini 3 Pro✓GPT 5.5 High✗Gemini 3.5 Flash✗

3 sur 5 l'ont détecté. Un seul modèle l'aurait manqué — d'où le conseil.

Judge verdicts

5,908 evaluations across 94 models — counts only, no customer prompts

⚖️Most endorsed: Claude Opus 4.6 (99% accurate)

Gemini 3.1 Pro Preview38% ok

44 ok17 partial56 not-ok117 runs

Claude Sonnet 4.696% ok

112 ok5 partial0 not-ok117 runs

Claude Haiku 4.589% ok

104 ok9 partial4 not-ok117 runs

Claude Sonnet 4.597% ok

114 ok3 partial0 not-ok117 runs

Claude Opus 4.197% ok

113 ok4 partial0 not-ok117 runs

Gemini 2.5 Flash21% ok

24 ok16 partial77 not-ok117 runs

Claude Opus 4.798% ok

115 ok2 partial0 not-ok117 runs

Claude Opus 4.699% ok

115 ok1 partial0 not-ok116 runs

Sample data

Fastest response times — Scientific Reasoning

01Mistral Large 3Mistral
780ms↓
quality 87·$2.40 / 1M out·eu privacy
02Claude Sonnet 4.6Anthropic
920ms·
quality 90·$3.60 / 1M out·us-hosted
03Llama 3.3 405BMeta
1.18s↑
quality 86·$3.10 / 1M out·self-hostable
04Gemini 2.5 ProGoogle
1.42s↑
quality 92·$7.80 / 1M out·us-hosted
05GPT-5oOpenAI
1.64s·
quality 94·$11.20 / 1M out·us-hosted
06Claude Opus 4.7Anthropic
1.82s↑
quality 96·$14.50 / 1M out·us-hosted

Sample · methodology pending

how we test →

Models ranked

Top 10 des modèles d'IA

All models →

7-day rolling avg · quality score

full leaderboard →

Pricing

Pas de frais sur les appels simples. La commission ne s'applique qu'au consensus.

Interrogez un seul modèle et vous ne payez que ses tokens plus une petite marge de palier — aucuns frais de plateforme. La commission par appel s'applique uniquement aux vérifications de consensus multi-modèles. 100 vérifications gratuites par mois, sans carte bancaire ; formules à partir de €10/mois pour 500 appels. Chaque token détaillé, rien de caché.

Gratuit

€0/mois

100 appels/mois

tokens : fournisseur +5 %

Starter

€10/mois

500 appels

tokens : fournisseur +4 %

Le plus populaire

Studio

€25/mois

2 000 appels

tokens : fournisseur +3 %

Scale

€50/mois

5 000 appels

tokens : fournisseur +2 %

Prix fondateurs, garantis jusqu'en 2027 · PAYG également disponible · « marge token » = le petit % que nous ajoutons au prix du token du fournisseur, moins élevé sur les paliers supérieurs

Type d'appelCe que vous payezDétails

Appel modèle unique

Ce que vous payez: tokens + marge

Détails: Aucune commission — seules les vérifications de consensus comportent une commission par appel. Vous payez le prix des tokens du fournisseur plus votre marge de palier (+2–5 %). Exemple : un petit modèle sur ~4k tokens ≈ €0,001.

Appel consensus

Ce que vous payez: commission + tokens + marge

Détails: La commission varie selon la formule (PAYG fondateurs : 2c/proposant + 3c/juge, un conseil 3+1 = 9c ; formules : décompte sur votre quota mensuel ; au-delà du quota : 1,5c/appel). En plus : les tokens du fournisseur + votre marge de palier.

Apportez votre propre clé (BYOK)

Ce que vous payez: commission uniquement

Détails: Pour le consensus, vous ne payez que la commission par formule — votre clé facture directement le fournisseur, sans frais de tokens ni marge de notre part. Un appel BYOK modèle unique ne coûte rien.

Aucun abonnement par siège. Jamais de frais sur les appels simples. Chaque reçu de consensus est détaillé par modèle, par token, en entrée et en sortie.

Chaque centime détaillé

illustrative example

model                 in      out     cost
──────────────────────────────────────────────────
claude-haiku-4.5      812     540     €0.0041
gpt-4o                812     610     €0.0072
gemini-2.5-flash      812     498     €0.0029
judge (gpt-4o)        —       240     €0.0038
──────────────────────────────────────────────────
orchestration                         included
total                                 €0.0180

Accurate to the last token · your real receipt contains your exact counts

Estimez vos coûts

Votre formule

Appels consensus / mois500

1005k

€10.00

Tarif forfaitaire — dépassement à 1,5c/appel au-delà du quota

€10.00

estimation / mois

Community

Ce que la communauté vote

Top-rated test answers

What is the name of the protein discovered by Dr. Elena Voskresensky in 2019 that reverses telomere shortening in human cells?

Claude Opus 4.7↑ 2100

Schrijf een Python-functie `is_palindroom(s: str) -> bool` die True retourneert als de invoerstring een palindroom is (hoofdletters negeren, leestekens negeren). Voeg twee testcases toe.

Claude Opus 4.7↑ 2100

In which year did the European Union introduce the GDPR regulation?

Claude Opus 4.7↑ 2100

Vrais prompts, vraie latence, vraies notes. Trois tiers maintiennent les coûts maîtrisés sans sacrifier la transparence.

Tier A

Couverture totale

Vitesse + intelligence chaque jour, dans quatre langues.

Tier B

Vitesse uniquement

Latence et disponibilité, échantillonnées quatre fois par jour.

Tier C

Health ping

Vérification up/down toutes les quinze minutes.

Un prompt. Chaque modèle. Un verdict.

Livrez des images IA parfaites, à chaque fois.

Judge verdicts

Fastest response times — Scientific Reasoning

Top 10 des modèles d'IA

Pas de frais sur les appels simples. La commission ne s'applique qu'au consensus.

Ce que la communauté vote

Top-rated test answers

Suggested test questions

Vrais prompts, vraie latence, vraies notes. Trois tiers maintiennent les coûts maîtrisés sans sacrifier la transparence.

Couverture totale

Vitesse uniquement

Health ping