Seviye C — Uzman

Çalıştığı yer:USYapıldığı yer:United States

$0.4000

çıktı · 1M token başına (maliyet bazı)

Maliyet

840 ms

Yanıt hızı

Henüz test edilmedi

Zeka

Karar — özetLIVE

● LIVE

şimdi · 2026-07-26

gpt-5-nano shows quality gains but reasoning collapses to zero

✓ Quality improved 12.4 points✓ Multilingual support now excellent✗ Reasoning capability dropped to zero✗ Factual accuracy remains weak

The latest benchmark window reveals a mixed picture for gpt-5-nano. Overall quality improved by 12.4 points to reach 41.3 out of 100, suggesting meaningful progress in model capabilities. However, this improvement masks serious category-level concerns that warrant attention. The most striking finding is the complete failure in reasoning tasks, which scored zero in the current window. This represents a critical regression in logical capabilities. Factual performance also remains weak at just 22 points, indicating the model struggles with knowledge accuracy and retrieval tasks. On the positive side, multilingual support has transformed dramatically from zero to 98 points, establishing gpt-5-nano as highly capable for cross-language applications. Creative tasks maintained stability at 45 points across both windows, showing consistency in generative capabilities. Latency showed modest improvement, dropping from 5084ms to 4833ms at the median, though response times remain relatively slow compared to industry standards. The model appears to have undergone significant architectural changes between windows, evidenced by the shift in tested categories from coding-focused to reasoning and factual assessments. Users should consider gpt-5-nano primarily for multilingual applications while avoiding reasoning-intensive workloads until this critical gap is addressed.

Quality

41.3

Latency p50

4,833 ms

Test runs

1 / 11

Görsel ve açıklamaLIVE

OpenAI

gpt-5-nano

Seviye C — Uzman

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan·Yayınlandı 22 Mayıs 2026·Son inceleme 26 Mayıs 2026

GPT-5-nano, OpenAI tarafından geliştirilen kompakt bir dil modelidir ve GPT-5 ailesi içinde verimli bir seçenek olarak konumlandırılmıştır. Bu model, hesaplama verimliliği ve düşük kaynak tüketiminin öncelikli olduğu, temel metin üretme yeteneklerini gerektiren uygulamalar için tasarlanmıştır. Basit içerik oluşturma, temel konuşma arayüzleri, özetleme görevleri ve en gelişmiş akıl yürütme yeteneklerini talep etmeyen diğer standart doğal dil işleme uygulamaları gibi kullanım senaryolarını hedeflemektedir. OpenAI'nin kademeli model stratejisinin bir parçası olarak GPT-5-nano, GPT-5 serisindeki giriş seviyesi seçeneği temsil eder. Bağlam penceresi özellikleri kamuya açıklanmamış olsa da model, modern dil modellerine özgü standart metin üretme yeteneklerini korur. "Nano" tanımı, GPT-5 ailesindeki diğer modellere kıyasla daha az parametre sayısını ifade eder; bu durum genellikle daha hızlı çıkarım hızları ve azaltılmış hesaplama gereksinimleriyle ilişkilendirilirken, karmaşık akıl yürütme görevlerinde bir miktar performans kaybına neden olur. GPT-5-nano, OpenAI'nin ürün hiyerarşisinde standart GPT-5 ve GPT-5-turbo varyantlarının altında yer almaktadır. Yüksek karmaşıklıkta veya nüanslı dil görevlerinin ele alınmasından çok yanıt hızı ve operasyonel verimliliğin daha fazla önem taşıdığı uygulamalara yapay zekâ destekli metin üretimini entegre etmek isteyen geliştiriciler ve kuruluşlar için uygundur. Model, OpenAI'nin API altyapısıyla uyumluluğunu korurken standart dil işleme ihtiyaçları için erişilebilir bir başlangıç noktası sunar.

OpenAI'nin kapsamlı eğitim verisi bu modelin geniş alan bilgisini destekliyor.
— Tokonomix benchmark özeti

Yetenekler

toolssource: litellmvisionjson modepdf inputreasoningjson schemaparallel toolsprompt cachingmax output tokens: 128000

GPT-5 Nano: orijinal en küçük katman, birçok yüksek hacimli işlem hattında

GPT-5 Nano, orijinal GPT-5 lansmanının en küçük katman modelidir. Lansmandan bu yana sayısız yüksek hacimli sınıflandırma işlem hattını, ön filtreleme aşamalarını, otomatik tamamlama yollarını ve basit veri çıkarma iş akışlarını çalıştırmıştır. Slug kayan (floating) bir slug; bu da bugün onu okuyan herkesin, OpenAI'nin şu anda önerilen gpt-5-nano olarak kabul ettiği ağırlıkları aldığı anlamına gelir — bir yıl önce slug'ın işaret ettiği şeyden sessizce farklı.

Kayan ve eskime sorununun birleşimi

En küçük katmanda kayan bir slug, operasyonel olarak en kötü senaryodur. Nano, çoğu yığında en yüksek hacimli trafiği taşır; bu da herhangi bir davranış kaymasının en fazla çıktıyı etkilemesi anlamına gelir. Eskime sorunu da burada geçerlidir — nesiller arasındaki nano iyileştirmeleri önemli olmuştur, bu nedenle bugün gpt-5-nano üzerinde çalışan model, lansmanda slug'ı besleyen modelden yetenek profili açısından anlamlı ölçüde farklıdır.

İki etki birleşerek katlanır. Bu slug'ı aktif olarak izlememiş ekipler, kayan-slug ömrü boyunca defalarca kaymış ağırlıklar üzerinde, lansman davranışına göre kalibre edilmiş orijinal bir entegrasyona karşı, biriken geçici çözümler aracılığıyla format ve kalite değişikliklerini sessizce emen alt sistemlerle birlikte çalışıyor olabilir.

Çözüm karmaşık değil: üretimde tarihli bir snapshot'ı sabitleyin, bir kanarya test paketi ile kaymayı izleyin, geçişleri kayan-slug rotasyonu yoluyla soğurmak yerine açıkça planlayın. Çözüm nano katmanında nadiren uygulanır çünkü iş yükleri tek tek bakıldığında düşük riskli hissettirir ve hacim, kümülatif maliyeti gizler.

Bu slug'ın hâlâ yaptığı şeyler

Küçük bir kategori seti üzerinde rutin sınıflandırma, öngörülebilir yapıya sahip basit alan çıkarımı ve kısa formatlı tamamlama için model faydalı işler yapmaya devam ediyor. Çağrı başına maliyet düşük. Gecikme profili ailedeki en düşük olanıdır.

Sınıflandırma çıktısına göre daha büyük katmanlara yükselten ön filtreleme işlem hatları için model, bugün bile ilk aşama olarak doğal şekilde oturuyor. Yükseltme deseni, kalite açığının büyük bir kısmını soğurur çünkü zor durumları daha büyük katmanlar üstlenir.

Kaputun altında

GPT-5 Nano, mini'den önemli ölçüde daha küçük bir parametre ölçeğinde bir transformer decoder modelidir; metin ve görüntü üzerinde çok modludur, ancak görüntü yeteneği daha büyük katmanlara göre belirgin biçimde daha zayıftır. OpenAI parametre sayılarını yayımlamamıştır.

Tokenizasyon, standart GPT-5 BPE sözcük dağarcığını kullanır. Görüntü girdileri, fayans (tile) başına sabit token maliyetiyle kodlanır. Bağlam penceresi, mutlak olarak daha büyük katmanlardan kısadır ve nominal sınıra ulaşmadan çok önce tutarlılık düşer.

Model, token başına mini'den önemli ölçüde daha ucuz, istek başına daha hızlıdır ve mini ile arasındaki fark, mini ile temel sürüm arasındaki farktan daha büyüktür. Lansman ağırlıkları için eğitim kesim tarihi 2025'in ortalarına denk gelir; kayan slug şu anda yenilenmiş bir snapshot'a işaret ediyorsa, etkin kesim tarihi farklı olabilir.

Bugün nerede duruyor

Mevcut en küçük katman tekliflerine karşı model — kayan slug'ın şu anda hangi snapshot'a çözümlendiğinden bağımsız olarak — çoğu kıyaslama boyutunda yeni GPT-5 nano'ların altında yer alıyor. Zekâ liderlik tablosu karşılaştırmalı konumu takip ediyor.

Basit uçtaki veri çıkarma ve kısa formatlı uçtaki içerik iş akışları için model hâlâ kullanılabilir çıktı üretiyor. Daha zorlu herhangi bir şey için yeni nano'lar açıkça daha iyidir.

Sınırlar nerede

Akıl yürütme sığ. Örüntü eşleştirmenin ötesinde çıkarım gerektiren her şey nano için yanlıştır.

Uzun bağlam tutarlılığı zayıf. İstemleri kompakt tutun.

Yapılandırılmış çıktı basit şemalarda çalışır, karmaşık olanlarda bozulur.

Niş konularda halüsinasyon, daha büyük katmanlara göre daha yüksek. Daha küçük kapasite kendini burada gösteriyor.

Görüntü kalitesi daha büyük katmanlardan belirgin biçimde düşüyor. Standart grafik okuma ve OCR çalışır; karmaşık diyagramlar ve düşmanca düzenler çoğu zaman çalışmaz.

İngilizce dışı performans daha zayıf, özellikle düşük kaynaklı dillerde.

Son gelişmelere dair bilgi, mevcut kayan-slug snapshot'unun kestiği yerde durur — bu, sizin teste tabi tuttuğunuzla eşleşebilir veya eşleşmeyebilir.

Bu slug'ın doğru seçim olduğu durumlar

Dar kullanım durumları:

Sınıflandırma kalitesinin ilk aşama için yeterince iyi olduğu ve yükseltmelerin zor durumları üstlendiği ön filtreleme işlem hatları çalıştırıyorsunuz.

Gecikmenin birincil kısıt olduğu ve kalite çıtasının "hiç öneri olmamasından daha iyi" olduğu, tuş başına otomatik tamamlama yapıyorsunuz.

Davranış kaymasının gerçekten tolere edilebilir olduğu dahili araçlar çalıştırıyorsunuz.

Tarihli bir sabitlemeye veya yeni bir nesle geçiş zamanı

Kararlılık gereksinimleri olan üretim trafiği çalıştırıyorsunuz ve sabitleme yapmamışsınız. Bu nesil için tarihli nano snapshot'ını sabitleyin veya daha yeni bir neslin tarihli nano'suna geçin.

Alt sistemleriniz belirli çıktı formatlarına bağlı ve sessiz geçici çözümler aracılığıyla format kaymasını soğuruyorsunuz.

Değerlendirme süreciniz zaman içinde karşılaştırılabilir sonuçlar üretmek zorunda, ki bunu kayan slug imkânsız kılıyor.

Denetim izlerinin herhangi bir çıktıyı üreten modeli tanımlaması gereken düzenlemeye tabi bir bağlamdasınız.

İş yükünüzde kaymanın veya yetenek açığının kümülatif maliyetini ölçtünüz ve bu, geçiş maliyetini aşıyor.

İki yol

Birinci yol: bu neslin tarihli snapshot'ını sabitleyin (gpt-5-nano-2025-08-07). Bu, yeteneği değiştirmeden davranışı stabilize eder. Mevcut kalitenin yeterli olduğu iş yükleri için mantıklıdır.

İkinci yol: daha yeni bir neslin tarihli nano'suna geçin (5.2 Nano, 5.4 Nano, 5.5 Nano). Bu, sabitleme disiplinine ek olarak yetenek iyileştirmeleri getirir. Mevcut kalitenin marjinal hale geldiği iş yükleri için mantıklıdır.

Her iki yol da hedefe karşı sürüm öncesi değerlendirme yapmayı, alt sistemleri doğrulamayı ve üretim trafiğini geçirmeyi içerir. Hiçbir şey yapmamak, kümülatif etkinin büyük olduğu bir katmanda kayan-slug kaymasını soğurmaya devam etmek anlamına gelir.

Alternatifler

Farklı bir sağlayıcıda sabitlenmiş en küçük katman davranışına ihtiyaç duyan iş yükleri için, Anthropic ve Google'ın karşılaştırılabilir nano eşdeğeri snapshot'ları aynı sabitleme deseniyle gelir.

Maksimum maliyet optimizasyonu için, kendi altyapınızda çalışan küçük açık ağırlıklı sınıflandırıcılar, dar görevlerde bu neslin nano'sunu, GPU harcaması ötesinde neredeyse sıfır marjinal maliyetle eşleyebilir.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Sağlayıcı karşılaştırmasıLIVE

Sağlayıcı karşılaştırması

Bu modeli sunan her sağlayıcıyı karşılaştırın — maliyet temeli, kalite, gecikme ve çalışma süresi.

Azure OpenAI (EU - Sweden)AB

Girdi maliyeti✓ en iyi$0.0500

Çıktı maliyeti$0.4000

KaliteHenüz test edilmedi

Gecikme (p50)Henüz test edilmedi

Çalışma süresiHenüz test edilmedi

Maliyetler 1M token başına (maliyet temeli)

OpenAIABDBu sunum

Girdi maliyeti$0.0500

Çıktı maliyeti$0.4000

KaliteHenüz test edilmedi

Gecikme (p50)✓ en iyi840 ms

Çalışma süresiHenüz test edilmedi

Maliyetler 1M token başına (maliyet temeli)

Konsensüs zekâsı

MODEL GENELİPASİF

Konsensüs sinyalleri model geneli — henüz sağlayıcı başına ayrılmadı.

Konsensüs puanlaması bu model için hâlâ veri topluyor — henüz sinyal yok.

Topluluk oylarıLIVE

Topluluk oyları

Gerçek ziyaretçiler ne düşünüyor — sağlayıcı başına.

Azure OpenAI (EU - Sweden)AB

Henüz topluluk oyu yok.

OpenAIABD

Henüz topluluk oyu yok.

Daha fazla sonuç — sağlayıcı başına

Kategoriye göre kalite

Oyun değerlendirmesi

Henüz veri yok.

Jüri kararı

■ Tamam 24%■ Kısmi 0%■ Yanlış 76%

Oyunlar ve arena

Henüz veri yok.

Hız ve sağlık

840 ms

Gecikme (p50)

—

Çalışma süresi

Kategoriye göre kalite

Oyun değerlendirmesi

Henüz veri yok.

Jüri kararı

■ Tamam 24%■ Kısmi 0%■ Yanlış 76%

Oyunlar ve arena

Henüz veri yok.

Hız ve sağlık

840 ms

Gecikme (p50)

—

Çalışma süresi

Soru & cevap — göz atLIVE

1 / 80

🧠 zekâOpenAImultilingual · 2026-07-26puan: 98

Bir mağazada %20 indirim uygulanıyor. 150 TL olan bir ürün indirimden sonra kaç TL olur?

120 TL. İndirim tutarı: 150 × 0.20 = 30 TL. Bölgenin indirimi sonrası fiyat: 150 − 30 = 120 TL.

Test geçmişi — tüm sağlayıcılarLIVE

Zaman içinde kalite puanıen son 42

Hız — zaman içinde p50 gecikmeen son 867 ms

📝Karar — özetLIVE

gpt-5-nano shows quality gains but reasoning collapses to zero

🖼️Görsel ve açıklamaLIVE

gpt-5-nano

Yetenekler

Kayan ve eskime sorununun birleşimi

Bu slug'ın hâlâ yaptığı şeyler

Kaputun altında

Bugün nerede duruyor

Sınırlar nerede

Bu slug'ın doğru seçim olduğu durumlar

Tarihli bir sabitlemeye veya yeni bir nesle geçiş zamanı

İki yol

Alternatifler

📊Sağlayıcı karşılaştırmasıLIVE

🧠Konsensüs zekâsı

👥Topluluk oylarıLIVE

🔬Daha fazla sonuç — sağlayıcı başına

💬Soru & cevap — göz atLIVE

🗂️Test geçmişi — tüm sağlayıcılarLIVE

Karar — özetLIVE

Görsel ve açıklamaLIVE

Sağlayıcı karşılaştırmasıLIVE

Konsensüs zekâsı

Topluluk oylarıLIVE

Daha fazla sonuç — sağlayıcı başına

Soru & cevap — göz atLIVE

Test geçmişi — tüm sağlayıcılarLIVE