Claude Sonnet 4.6412msGPT-5o589msMistral 24B1.1sLlama 3.3 70B780msGemini 2.5634msDeepSeek-V3952msClaude Sonnet 4.6412msGPT-5o589msMistral 24B1.1sLlama 3.3 70B780msGemini 2.5634msDeepSeek-V3952msClaude Sonnet 4.6412msGPT-5o589msMistral 24B1.1sLlama 3.3 70B780msGemini 2.5634msDeepSeek-V3952ms
Canlı benchmarks · Her gün güncellenir
YZ, ölçüldü.
Dünyanın önde gelen dil modelleri için bağımsız gecikme ve kalite skorları. Her gün güncellenir, dört dilde, tam soru seti yayınlanır.
Önemli modelleri takip et
Frontier düzey Claude ve GPT'den hızlı açık ağırlıklı Llama ve Mistral'a kadar — hepsini test ediyoruz.
Anthropic
Yakında
OpenAI
Yakında
Mistral
Yakında
Meta Llama
Yakında
Google Gemini
Yakında
DeepSeek
Yakında
Cohere
Yakında
xAI Grok
Yakında
Nasıl test ediyoruz
Gerçek sorular, gerçek gecikme, gerçek puanlar. Üç katmanlı yapı şeffaflıktan ödün vermeden maliyeti kontrol altında tutar.
Tier A
Tam kapsam
Dört dilde her gün hız + zeka testi.
Tier B
Yalnızca hız
Gecikme ve erişilebilirlik, günde dört kez ölçülür.
Tier C
Sağlık kontrolü
Her on beş dakikada bir açık/kapalı kontrolü.
Herhangi bir modeli deneyin — tam burada
Bir model seçin, bir soru yazın, cevabın akışını izleyin. Kayıt yok, ödeme yok, bağlam değişikliği yok.
Canlı test aracını aç →