İçeriğe geç
Seviye C — Uzman
Çalıştığı yer:FranceYapıldığı yer:United States
OVH AI Endpoints (GRA)

gpt-oss-20b

Seviye C — Uzman

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··

GPT-OSS-20B, OVH AI Endpoints üzerinden sunulan ve özellikle OVH'nin Fransa'daki Gravelines (GRA) veri merkezi bölgesinde barındırılan bir metin üretme modelidir. Bu model; metin tamamlama, soru yanıtlama ve genel sohbet görevleri dahil olmak üzere standart doğal dil işleme yetenekleri sağlar. OVH'nin AI Endpoints hizmetinin bir parçası olarak, OVH'nin Avrupa bulut altyapısı içinde çalışır ve bu durum onu, AB içinde veri ikametgâhı gerektiren ya da Avrupa merkezli hesaplama kaynaklarını tercih eden kullanıcılar için konumlandırır. Modelin bağlam penceresi özellikleri kamuya açık olarak belgelenmemiştir; ancak kurumsal ve geliştirici uygulamaları için tipik dil modeli işlemlerini destekler. GPT-OSS-20B; çok modlu işleme, fonksiyon çağırma veya diğer ileri düzey yetenekler gibi özel özellikler olmaksızın standart metin üretimi iş yüklerini yönetir. Otomatik metin üretimi, içerik işleme veya sohbet arayüzleri gerektiren uygulamalara entegre edilmeye uygun, sade bir dil modeli olarak işlev görür. OVH'nin AI Endpoints portföyünde GPT-OSS-20B, hâlihazırda OVH'nin bulut hizmetlerini kullanan ya da Avrupa veri merkezlerinde barındırılan AI çıkarım yetenekleri arayan kuruluşlar için erişilebilir bir seçenek sunar. Model; özel ya da amiral gemisi bir teklif olmaktan ziyade genel amaçlı bir dil modeli olarak hizmet verir ve OVH altyapısı üzerinde uygulama geliştiren yazılımcılara temel düzeyde metin üretme işlevi sağlar. OVH AI Endpoints aracılığıyla erişilebilir olması, sağlayıcının ağı içinde coğrafi veri yerelliğini korurken diğer OVH hizmetleriyle entegrasyona olanak tanır.

Avrupa'da barındırılan bu model, GDPR uyumluluğu gerektiren kurumlar için güvenli bir seçenek sunuyor.

Tokonomix benchmark özeti
Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme97 runs
33790015767236333150005-2206-15ms
Bölüm 02

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

100
Kod üretimi
92
Çok dilli
100
Akıl yürütme
Bölüm 03

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — gpt-oss-20b
$0.0400 1M giriş token başına
$0.1500 1M çıkış token başına
≈ <$0.0001 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$0.0400
1M çıkış token başına$0.1500

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.0400

input / 1M

— stable

$0.1500

output / 1M

— stable

2026-06-142026-06-142026-06-14
Input
Output
Price change
⟳ synced weekly
Bölüm 04

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)778 / avg 728
594616

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 05

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

GDPR uyumlu Avrupa altyapısıVeri egemenliği güvencesiMetin üretimi ve özetlemeÇok turlu sohbet desteğiTalimat takibinde yüksek başarıDoğal dil anlama kapasitesi

Zayıf yönler

Bölgesel altyapı gecikme değişkenliğiİnternet erişimi bulunmuyorGörsel işleme desteği yok
Bölüm 06

Yetenekler

ownedBy: OpenAI
Bölüm 07

Sık sorulan sorular

OVH GRA veri merkezinde barındırılan model, Avrupa veri egemenliği gereksinimlerini destekliyor.

OVH Avrupa altyapısı üzerindeki bu model, veri egemenliği açısından stratejik bir tercih.

Tokonomix benchmark özeti
Bölüm 08

Kullanılabilirlik

Kullanılabilirlik

Henüz ölçüm verisi yok

Bu model için kullanılabilirlik istatistiklerini göstermek için yeterli API çağrısı henüz kaydedilmedi. Veri, model canlı trafik almaya başlayınca görünür.

Bölüm 09

Tokonomix kıyaslama kararları

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-578/100 · 12 runs
9 correct0 partial3 wrong75% accuracy
2026-06-14

gpt-oss-20b maintains stable performance across all measured metrics

The gpt-oss-20b model from OVH AI Endpoints continues to demonstrate consistent performance characteristics across the current benchmark window. All core metrics remain unchanged from the previous evaluation period, indicating operational stability. The model maintains its median time to first token at 0.31 seconds and output speed at 94.17 tokens per second, showing reliable latency characteristics for production use. Quality scores hold steady with a median of 0.80, suggesting consistent output characteristics. The model continues to serve successfully without availability issues. Users can expect the same level of performance they experienced in the previous benchmark period, with no degradation or improvement in measurable metrics. This stability may be valuable for applications requiring predictable behavior and consistent response times. The model appears well-suited for workloads where maintaining established performance baselines is important. While no performance improvements are evident in this window, the absence of regression suggests reliable operation. Users should be aware that while pricing has been updated in this period, the technical performance profile remains entirely stable.

Quality

Latency p50

Test runs

0

Stable latency metrics maintained Consistent quality scores No performance regression detected
Bölüm 10

Tam model profili

gpt-oss-20b — illustration 1
OVH gpt-oss-20b: OpenAI'nin açık ağırlıklı soyunun yalın varyantı, AB egemen barındırmasında

OVH AI Endpoints, gpt-oss-20b modelini Gravelines (Fransa) veri merkezinden sunuyor; bu model, aynı OpenAI açık ağırlıklı ailesindeki 120b sürümünün 20 milyar parametreli daha küçük kardeşi. Daha büyük varyantla kıyaslandığında ödünleşimler açık: daha az yetenek, daha hızlı yanıtlar, daha düşük işlem yükü. Değişmeyen şey ise AB egemen barındırma hikâyesi ve üretim ekiplerinin yıllardır kalibre ettiği OpenAI soyağacı.

20b kademesi gerçekte ne sunuyor

20 milyar parametrelik ölçek; genel amaçlı metin üretimi, talimat takibi, yapılandırılmış çıktı ve orta düzeyde karmaşık çok turlu konuşmalar için yeterince büyük. Tam 120b'nin gereğinden fazla olduğu iş yüklerinde 20b, aynı şekildeki görevleri işlem maliyetinin küçük bir kısmıyla ve önemli ölçüde daha düşük gecikmeyle ele alıyor.

Orta kapsamlı kod üretimi iyi çalışıyor. Birkaç düzine satırlık betikler yazmak, küçük fonksiyonları yeniden düzenlemek, tanıdık olmayan kodun ne yaptığını açıklamak. 20b, günlük geliştirici yardımı için önemli olan vakaların çoğunu, bir 120b modelinin yüksek frekanslı kullanımının getireceği maliyet profiline takılmadan karşılayacaktır.

Çok dilli kapsama, daha büyük modelden devralınıyor. Fransızca, Almanca, Hollandaca, İspanyolca, İtalyanca, Portekizce ve Lehçe 20b kademesinde iyi çalışıyor; ancak nüanslı edebi çeviri ve karmaşık alana özgü terminoloji, 120b'nin daha iyi ele alacağı zayıflıklar göstermeye başlıyor. Müşteri destek çevirisi, pazarlama metni uyarlaması ve çoğu günlük çok dilli iş için 20b yeterlidir.

OVH barındırma, 120b ile aynı AB egemen veri ikametgâhı hikâyesini sunuyor. Trafik Fransa'da kalıyor. Operasyonlar Fransız ve Avrupa veri yasalarına tabi. AB müşterileriyle yapılan veri işleme sözleşmesi görüşmesi sade ve sorunsuz.

Nerede işe yarıyor

Çağrı başına maliyetin baskın olduğu ve ortalama görev karmaşıklığının ılımlı kaldığı yüksek hacimli metin iş yükleri. Müşteri desteği için sohbet botu arka uçları, içerik moderasyon hatları, ileri düzey akıl yürütme gerektirmeyen belgeler üzerinde yapılandırılmış çıkarım iş akışları, toplu özetleme görevleri.

20b'nin daha hızlı çıkarımının önemli olduğu, gecikmeye duyarlı uygulamalar. Kullanıcının modelin düşünmesini beklemek yerine birkaç saniye içinde yanıt beklediği etkileşimli sohbet arayüzleri. Modelin arka plan toplu işi olmaktan ziyade kullanıcının yazımına veya gezinmesine yetişmek zorunda olduğu gerçek zamanlı içerik zenginleştirme.

Rutin işler için daha büyük 120b'yi haklı çıkarmayan bütçe zarfıyla AB barındırma gereksinimleri. Egemenlik hikâyesi sert bir gereksinim olduğunda ve iş yükü büyük modelin yetenek tavanına ihtiyaç duymadığında 20b doğru kademedir.

Daha üst kademe çıkarıma yatırım yapıp yapmamaya karar vermeden önce istemler ve mimariler üzerinde hızlıca iterasyon yapmak istediğiniz geliştirme ve prototipleme iş akışları. 20b'nin daha düşük maliyeti ve daha hızlı yanıt süresi, bir uygulama oluşturmanın hızlı iterasyon aşaması için daha uygun seçenektir.

Nerede yetersiz kalıyor

Daha büyük parametre ölçeğinden fayda sağlayan karmaşık akıl yürütme görevleri. 20b, zor sorulara makul görünen yanıtlar üretecektir, ancak gpt-oss-120b modelinin yakaladığı incelikleri kaçıracaktır. Akıl yürütme derinliğinin önemli olduğu ve AB barındırmasının zorunlu olduğu iş yükleri için 120b daha doğru kademedir.

Önemli kapsamda kod sentezi. Anlamlı karmaşıklıkta bir algoritma yazmak, birbiriyle etkileşen birçok ilgiyi olan dolaşık bir fonksiyonu yeniden düzenlemek, önemsiz olmayan test paketleri üretmek. 20b küçük kapsamlı kodlamayı iyi ele alır, ancak kapsam büyüdükçe hata oranı tırmanır.

Sınır seviyesi yetenek iş yükleri. Hiçbir 20b modeli, tescilli sınır modellerin ulaştığı mutlak yetenek tavanıyla rekabet edemez. 20b hacim kademesidir, sınır kademesi değildir; gerçek anlamda sınır yeteneği gerektiren iş yükleri için kullanmak hayal kırıklığı yaratan çıktılar verir.

Çok modlu çalışma. Model yalnızca metindir. Görsel, ses veya çok modlu yetenek için OVH, aynı AB egemen barındırma deseni üzerinden görsel-dil çalışması için qwen2.5-vl-72b-instruct gibi başka model aileleri sunar.

Bunu seçmek mi yoksa üst kademeye çıkmak mı

Ölçeklenebilir bir maliyet profilinde OpenAI soyağacını isteyen, yüksek hacimli metin uygulamaları kuran AB müşterileri için OVH üzerindeki gpt-oss-20b doğru varsayılan seçenektir. Bu yapılandırma, 120b'nin eşleşemeyeceği birim ekonomisinde rutin metin iş yüklerinin büyük kısmını karşılar.

Yeteneğin maliyetten daha önemli olduğu iş yükleri için gpt-oss-120b, aynı soyağacı ve aynı barındırma ortamı içindeki yükseltmedir. Geçiş, API yüzeyinde önemsiz düzeydedir. Maliyet farkı anlamlıdır, dolayısıyla soru, iş yükünüzün gerçekten daha büyük modele ihtiyaç duyup duymadığıdır.

20b parametre ölçeğinde olup özellikle OpenAI soyağacına ihtiyaç duymayan iş yükleri için OVH güçlü alternatifler sunar. llama-3.1-8b-instruct aynı genel yetenek kademesinin daha küçük ucunda yer alır. mistral-small-3.2-24b-instruct-2506 benzer ölçekteki Avrupa kökenli alternatiftir. qwen3-32b ise yine AB egemen barındırma zarfı içinde, biraz daha yüksek parametre sayısında başka bir genel amaçlı seçenektir.

Gerçek sınır yeteneğine ihtiyaç duyan ve AB dışı barındırmayı kabul edebilen iş yükleri için, daha yeni akıl yürütme ve çok modlu modellerle doğrudan OpenAI API'si alternatif yoldur. AB egemen yetenekli çıkarım ile sınır yetenekli ABD merkezli çıkarım arasındaki seçim, bu modelin bilgilendirmek için var olduğu stratejik karardır.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

gpt-oss-20b — illustration 2
Son otomatik test
15 Haz 2026 · 08:00 UTC · Hız testi
P50 gecikme
257 ms
P95 gecikme
375 ms
Hatalar
0 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·26 Mayıs 2026