İçeriğe geç
Tokonomix
Claude Sonnet 4.6412msGPT-5o589msMistral 24B1.1sLlama 3.3 70B780msGemini 2.5634msDeepSeek-V3952msClaude Sonnet 4.6412msGPT-5o589msMistral 24B1.1sLlama 3.3 70B780msGemini 2.5634msDeepSeek-V3952msClaude Sonnet 4.6412msGPT-5o589msMistral 24B1.1sLlama 3.3 70B780msGemini 2.5634msDeepSeek-V3952ms
Canlı benchmarks · Her gün güncellenir

YZ, ölçüldü.

Dünyanın önde gelen dil modelleri için bağımsız gecikme ve kalite skorları. Her gün güncellenir, dört dilde, tam soru seti yayınlanır.

Önemli modelleri takip et

Frontier düzey Claude ve GPT'den hızlı açık ağırlıklı Llama ve Mistral'a kadar — hepsini test ediyoruz.

Anthropic
Yakında
OpenAI
Yakında
Mistral
Yakında
Meta Llama
Yakında
Google Gemini
Yakında
DeepSeek
Yakında
Cohere
Yakında
xAI Grok
Yakında

Nasıl test ediyoruz

Gerçek sorular, gerçek gecikme, gerçek puanlar. Üç katmanlı yapı şeffaflıktan ödün vermeden maliyeti kontrol altında tutar.

Tier A

Tam kapsam

Dört dilde her gün hız + zeka testi.

Tier B

Yalnızca hız

Gecikme ve erişilebilirlik, günde dört kez ölçülür.

Tier C

Sağlık kontrolü

Her on beş dakikada bir açık/kapalı kontrolü.

Herhangi bir modeli deneyin — tam burada

Bir model seçin, bir soru yazın, cevabın akışını izleyin. Kayıt yok, ödeme yok, bağlam değişikliği yok.

Canlı test aracını aç