Hangi dil görevlerinde öne çıkıyor?

Metin üretimi, soru-cevap, özetleme ve genel dil işleme görevlerinde güçlü performans sunuyor.

OVH altyapısının avantajı ne?

Avrupa merkezli hesaplama, düşük gecikme ve veri mahremiyeti uyumluluğu sağlıyor.

Parametre sayısının önemi nedir?

Büyük parametre sayısı daha derin bağlam anlama sağlar; kullanım senaryonuza göre doğru modeli seçin.

Seviye C — Uzman

Çalıştığı yer:FranceYapıldığı yer:United States

OVH AI Endpoints (GRA)

gpt-oss-20b

Q: Bu model GDPR gereksinimlerini karşılıyor mu?

OVH GRA veri merkezinde barındırılan model, Avrupa veri egemenliği gereksinimlerini destekliyor.

Seviye C — Uzman

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan·Yayınlandı 22 Mayıs 2026·Son inceleme 26 Mayıs 2026

GPT-OSS-20B, OVH AI Endpoints üzerinden sunulan ve özellikle OVH'nin Fransa'daki Gravelines (GRA) veri merkezi bölgesinde barındırılan bir metin üretme modelidir. Bu model; metin tamamlama, soru yanıtlama ve genel sohbet görevleri dahil olmak üzere standart doğal dil işleme yetenekleri sağlar. OVH'nin AI Endpoints hizmetinin bir parçası olarak, OVH'nin Avrupa bulut altyapısı içinde çalışır ve bu durum onu, AB içinde veri ikametgâhı gerektiren ya da Avrupa merkezli hesaplama kaynaklarını tercih eden kullanıcılar için konumlandırır. Modelin bağlam penceresi özellikleri kamuya açık olarak belgelenmemiştir; ancak kurumsal ve geliştirici uygulamaları için tipik dil modeli işlemlerini destekler. GPT-OSS-20B; çok modlu işleme, fonksiyon çağırma veya diğer ileri düzey yetenekler gibi özel özellikler olmaksızın standart metin üretimi iş yüklerini yönetir. Otomatik metin üretimi, içerik işleme veya sohbet arayüzleri gerektiren uygulamalara entegre edilmeye uygun, sade bir dil modeli olarak işlev görür. OVH'nin AI Endpoints portföyünde GPT-OSS-20B, hâlihazırda OVH'nin bulut hizmetlerini kullanan ya da Avrupa veri merkezlerinde barındırılan AI çıkarım yetenekleri arayan kuruluşlar için erişilebilir bir seçenek sunar. Model; özel ya da amiral gemisi bir teklif olmaktan ziyade genel amaçlı bir dil modeli olarak hizmet verir ve OVH altyapısı üzerinde uygulama geliştiren yazılımcılara temel düzeyde metin üretme işlevi sağlar. OVH AI Endpoints aracılığıyla erişilebilir olması, sağlayıcının ağı içinde coğrafi veri yerelliğini korurken diğer OVH hizmetleriyle entegrasyona olanak tanır.

gpt-oss-20b ile kendi sorularını test et

Avrupa'da barındırılan bu model, GDPR uyumluluğu gerektiren kurumlar için güvenli bir seçenek sunuyor.
— Tokonomix benchmark özeti

Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme102 runs

Bölüm 02

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

Yaratıcı

Olgusal

100

Çok dilli

Akıl yürütme

Bölüm 03

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰

API tarifeleri — gpt-oss-20b

$0.0400 1M giriş token başına

$0.1500 1M çıkış token başına

≈ <$0.0001 tipik konuşma başına (800 token)

Giriş vs çıkış fiyatı (1M token başına)

1M giriş token başına$0.0400

1M çıkış token başına$0.1500

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.0400

input / 1M

— stable

$0.1500

output / 1M

— stable

2026-06-142026-06-282026-07-26

Input

Output

Price change

⟳ synced weekly

Bölüm 04

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)833 / avg 738

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 05

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

GDPR uyumlu Avrupa altyapısıVeri egemenliği güvencesiMetin üretimi ve özetlemeÇok turlu sohbet desteğiTalimat takibinde yüksek başarıDoğal dil anlama kapasitesi

Zayıf yönler

Bölgesel altyapı gecikme değişkenliğiİnternet erişimi bulunmuyorGörsel işleme desteği yok

Bölüm 06

Yetenekler

ownedBy: OpenAI

Bölüm 07

Sık sorulan sorular

OVH GRA veri merkezinde barındırılan model, Avrupa veri egemenliği gereksinimlerini destekliyor.

OVH Avrupa altyapısı üzerindeki bu model, veri egemenliği açısından stratejik bir tercih.
— Tokonomix benchmark özeti

Bölüm 08

Kullanılabilirlik

Bu modelin çağrıldığında ne sıklıkla yanıt verdiği — son 30 gün içindeki gerçek API istekleri ve canlı testler üzerinden ölçülmüştür. Bu kaliteden bağımsızdır: bu sayılar yalnızca modelin yanıt verip vermediğini gösterir, yanıtın ne kadar iyi olduğunu değil.

Son 7 gün

—

Son 30 gün

100.0%

n=1

Medyan yanıt süresi

449ms

n=1

Baz alınan 381 ölçüm son 30 gün içinde.

Teknik detaylar

Yalnızca gerçek API çağrıları ve canlı test istekleri sayılır — dahili yoklamalar ve kıyaslama çalıştırmaları hariçtir.

Özel API anahtarıyla (BYOK) yapılan çağrılar hariçtir: bu hatalar anahtara özgüdür, model kesintisinin işareti değildir.

Başarısız çağrılar kalite puanlarına DAHİL EDİLMEZ — kalite yalnızca başarılı yanıtlar üzerinden ölçülür. Kullanılabilirlik ve kalite bağımsız sinyallerdir.

Kaydedilmiş süreye sahip başarılı çağrılarda medyan yanıt süresi (p50). Aykırı değerler medyanı ortalamadan daha az etkiler.

Toplam çağrı (30d)

OK yanıtlar (30d)

Toplam çağrı (7d)

OK yanıtlar (7d)

Bölüm 09

Tokonomix kıyaslama kararları

⚖️

Endorsed by 2 judges

Independent LLM judges evaluated this model on our weekly intelligence tests

cohere/command-a100/100 · 1 runs

1 correct0 partial0 wrong100% accuracy

claude-sonnet-4-579/100 · 52 runs

39 correct3 partial10 wrong75% accuracy

● 2026-07-26

gpt-oss-20b plummets to 48.5 as factual and reasoning scores hit zero

This benchmark window reveals a dramatic performance collapse for gpt-oss-20b, with the overall quality score dropping 45.6 points from 94.1 to 48.5. The most alarming development is the complete failure in factual and reasoning categories, both scoring zero compared to strong previous performance. This suggests a fundamental regression in the model's core capabilities for logical processing and accurate information retrieval. The creative writing score surged to 94, up from 85, and multilingual support maintained its perfect 100 rating, demonstrating that some capabilities remain intact. Latency improved slightly from 7330ms to 7132ms at the median, though this minor speed gain is overshadowed by the quality deterioration. The test sample size remained consistent at 5 runs per window. Users should exercise caution deploying this model for factual or analytical tasks until these critical regressions are addressed. The selective nature of the failures, with creative and multilingual tasks unaffected while reasoning collapses entirely, points to a possible configuration issue or model version regression rather than general degradation.

Quality

48.5

Latency p50

7,132 ms

Test runs

✗ Factual accuracy dropped to zero✗ Reasoning capability completely failed✓ Creative score improved to 94✓ Multilingual remains perfect at 100

Bölüm 10

Tam model profili

OVH gpt-oss-20b: OpenAI'nin açık ağırlıklı soyunun yalın varyantı, AB egemen barındırmasında

OVH AI Endpoints, gpt-oss-20b modelini Gravelines (Fransa) veri merkezinden sunuyor; bu model, aynı OpenAI açık ağırlıklı ailesindeki 120b sürümünün 20 milyar parametreli daha küçük kardeşi. Daha büyük varyantla kıyaslandığında ödünleşimler açık: daha az yetenek, daha hızlı yanıtlar, daha düşük işlem yükü. Değişmeyen şey ise AB egemen barındırma hikâyesi ve üretim ekiplerinin yıllardır kalibre ettiği OpenAI soyağacı.

20b kademesi gerçekte ne sunuyor

20 milyar parametrelik ölçek; genel amaçlı metin üretimi, talimat takibi, yapılandırılmış çıktı ve orta düzeyde karmaşık çok turlu konuşmalar için yeterince büyük. Tam 120b'nin gereğinden fazla olduğu iş yüklerinde 20b, aynı şekildeki görevleri işlem maliyetinin küçük bir kısmıyla ve önemli ölçüde daha düşük gecikmeyle ele alıyor.

Orta kapsamlı kod üretimi iyi çalışıyor. Birkaç düzine satırlık betikler yazmak, küçük fonksiyonları yeniden düzenlemek, tanıdık olmayan kodun ne yaptığını açıklamak. 20b, günlük geliştirici yardımı için önemli olan vakaların çoğunu, bir 120b modelinin yüksek frekanslı kullanımının getireceği maliyet profiline takılmadan karşılayacaktır.

Çok dilli kapsama, daha büyük modelden devralınıyor. Fransızca, Almanca, Hollandaca, İspanyolca, İtalyanca, Portekizce ve Lehçe 20b kademesinde iyi çalışıyor; ancak nüanslı edebi çeviri ve karmaşık alana özgü terminoloji, 120b'nin daha iyi ele alacağı zayıflıklar göstermeye başlıyor. Müşteri destek çevirisi, pazarlama metni uyarlaması ve çoğu günlük çok dilli iş için 20b yeterlidir.

OVH barındırma, 120b ile aynı AB egemen veri ikametgâhı hikâyesini sunuyor. Trafik Fransa'da kalıyor. Operasyonlar Fransız ve Avrupa veri yasalarına tabi. AB müşterileriyle yapılan veri işleme sözleşmesi görüşmesi sade ve sorunsuz.

Nerede işe yarıyor

Çağrı başına maliyetin baskın olduğu ve ortalama görev karmaşıklığının ılımlı kaldığı yüksek hacimli metin iş yükleri. Müşteri desteği için sohbet botu arka uçları, içerik moderasyon hatları, ileri düzey akıl yürütme gerektirmeyen belgeler üzerinde yapılandırılmış çıkarım iş akışları, toplu özetleme görevleri.

20b'nin daha hızlı çıkarımının önemli olduğu, gecikmeye duyarlı uygulamalar. Kullanıcının modelin düşünmesini beklemek yerine birkaç saniye içinde yanıt beklediği etkileşimli sohbet arayüzleri. Modelin arka plan toplu işi olmaktan ziyade kullanıcının yazımına veya gezinmesine yetişmek zorunda olduğu gerçek zamanlı içerik zenginleştirme.

Rutin işler için daha büyük 120b'yi haklı çıkarmayan bütçe zarfıyla AB barındırma gereksinimleri. Egemenlik hikâyesi sert bir gereksinim olduğunda ve iş yükü büyük modelin yetenek tavanına ihtiyaç duymadığında 20b doğru kademedir.

Daha üst kademe çıkarıma yatırım yapıp yapmamaya karar vermeden önce istemler ve mimariler üzerinde hızlıca iterasyon yapmak istediğiniz geliştirme ve prototipleme iş akışları. 20b'nin daha düşük maliyeti ve daha hızlı yanıt süresi, bir uygulama oluşturmanın hızlı iterasyon aşaması için daha uygun seçenektir.

Nerede yetersiz kalıyor

Daha büyük parametre ölçeğinden fayda sağlayan karmaşık akıl yürütme görevleri. 20b, zor sorulara makul görünen yanıtlar üretecektir, ancak gpt-oss-120b modelinin yakaladığı incelikleri kaçıracaktır. Akıl yürütme derinliğinin önemli olduğu ve AB barındırmasının zorunlu olduğu iş yükleri için 120b daha doğru kademedir.

Önemli kapsamda kod sentezi. Anlamlı karmaşıklıkta bir algoritma yazmak, birbiriyle etkileşen birçok ilgiyi olan dolaşık bir fonksiyonu yeniden düzenlemek, önemsiz olmayan test paketleri üretmek. 20b küçük kapsamlı kodlamayı iyi ele alır, ancak kapsam büyüdükçe hata oranı tırmanır.

Sınır seviyesi yetenek iş yükleri. Hiçbir 20b modeli, tescilli sınır modellerin ulaştığı mutlak yetenek tavanıyla rekabet edemez. 20b hacim kademesidir, sınır kademesi değildir; gerçek anlamda sınır yeteneği gerektiren iş yükleri için kullanmak hayal kırıklığı yaratan çıktılar verir.

Çok modlu çalışma. Model yalnızca metindir. Görsel, ses veya çok modlu yetenek için OVH, aynı AB egemen barındırma deseni üzerinden görsel-dil çalışması için qwen2.5-vl-72b-instruct gibi başka model aileleri sunar.

Bunu seçmek mi yoksa üst kademeye çıkmak mı

Ölçeklenebilir bir maliyet profilinde OpenAI soyağacını isteyen, yüksek hacimli metin uygulamaları kuran AB müşterileri için OVH üzerindeki gpt-oss-20b doğru varsayılan seçenektir. Bu yapılandırma, 120b'nin eşleşemeyeceği birim ekonomisinde rutin metin iş yüklerinin büyük kısmını karşılar.

Yeteneğin maliyetten daha önemli olduğu iş yükleri için gpt-oss-120b, aynı soyağacı ve aynı barındırma ortamı içindeki yükseltmedir. Geçiş, API yüzeyinde önemsiz düzeydedir. Maliyet farkı anlamlıdır, dolayısıyla soru, iş yükünüzün gerçekten daha büyük modele ihtiyaç duyup duymadığıdır.

20b parametre ölçeğinde olup özellikle OpenAI soyağacına ihtiyaç duymayan iş yükleri için OVH güçlü alternatifler sunar. llama-3.1-8b-instruct aynı genel yetenek kademesinin daha küçük ucunda yer alır. mistral-small-3.2-24b-instruct-2506 benzer ölçekteki Avrupa kökenli alternatiftir. qwen3-32b ise yine AB egemen barındırma zarfı içinde, biraz daha yüksek parametre sayısında başka bir genel amaçlı seçenektir.

Gerçek sınır yeteneğine ihtiyaç duyan ve AB dışı barındırmayı kabul edebilen iş yükleri için, daha yeni akıl yürütme ve çok modlu modellerle doğrudan OpenAI API'si alternatif yoldur. AB egemen yetenekli çıkarım ile sınır yetenekli ABD merkezli çıkarım arasındaki seçim, bu modelin bilgilendirmek için var olduğu stratejik karardır.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Son otomatik test

30 Tem 2026 · 14:04 UTC · Hız testi

P50 gecikme

240 ms

P95 gecikme

244 ms

Hatalar

0 / 6 çalıştırma

Son inceleyen Tokonomix Ekibi·26 Mayıs 2026