
OVH AI Endpoints, gpt-oss-20b modelini Gravelines (Fransa) veri merkezinden sunuyor; bu model, aynı OpenAI açık ağırlıklı ailesindeki 120b sürümünün 20 milyar parametreli daha küçük kardeşi. Daha büyük varyantla kıyaslandığında ödünleşimler açık: daha az yetenek, daha hızlı yanıtlar, daha düşük işlem yükü. Değişmeyen şey ise AB egemen barındırma hikâyesi ve üretim ekiplerinin yıllardır kalibre ettiği OpenAI soyağacı.
20b kademesi gerçekte ne sunuyor
20 milyar parametrelik ölçek; genel amaçlı metin üretimi, talimat takibi, yapılandırılmış çıktı ve orta düzeyde karmaşık çok turlu konuşmalar için yeterince büyük. Tam 120b'nin gereğinden fazla olduğu iş yüklerinde 20b, aynı şekildeki görevleri işlem maliyetinin küçük bir kısmıyla ve önemli ölçüde daha düşük gecikmeyle ele alıyor.
Orta kapsamlı kod üretimi iyi çalışıyor. Birkaç düzine satırlık betikler yazmak, küçük fonksiyonları yeniden düzenlemek, tanıdık olmayan kodun ne yaptığını açıklamak. 20b, günlük geliştirici yardımı için önemli olan vakaların çoğunu, bir 120b modelinin yüksek frekanslı kullanımının getireceği maliyet profiline takılmadan karşılayacaktır.
Çok dilli kapsama, daha büyük modelden devralınıyor. Fransızca, Almanca, Hollandaca, İspanyolca, İtalyanca, Portekizce ve Lehçe 20b kademesinde iyi çalışıyor; ancak nüanslı edebi çeviri ve karmaşık alana özgü terminoloji, 120b'nin daha iyi ele alacağı zayıflıklar göstermeye başlıyor. Müşteri destek çevirisi, pazarlama metni uyarlaması ve çoğu günlük çok dilli iş için 20b yeterlidir.
OVH barındırma, 120b ile aynı AB egemen veri ikametgâhı hikâyesini sunuyor. Trafik Fransa'da kalıyor. Operasyonlar Fransız ve Avrupa veri yasalarına tabi. AB müşterileriyle yapılan veri işleme sözleşmesi görüşmesi sade ve sorunsuz.
Nerede işe yarıyor
Çağrı başına maliyetin baskın olduğu ve ortalama görev karmaşıklığının ılımlı kaldığı yüksek hacimli metin iş yükleri. Müşteri desteği için sohbet botu arka uçları, içerik moderasyon hatları, ileri düzey akıl yürütme gerektirmeyen belgeler üzerinde yapılandırılmış çıkarım iş akışları, toplu özetleme görevleri.
20b'nin daha hızlı çıkarımının önemli olduğu, gecikmeye duyarlı uygulamalar. Kullanıcının modelin düşünmesini beklemek yerine birkaç saniye içinde yanıt beklediği etkileşimli sohbet arayüzleri. Modelin arka plan toplu işi olmaktan ziyade kullanıcının yazımına veya gezinmesine yetişmek zorunda olduğu gerçek zamanlı içerik zenginleştirme.
Rutin işler için daha büyük 120b'yi haklı çıkarmayan bütçe zarfıyla AB barındırma gereksinimleri. Egemenlik hikâyesi sert bir gereksinim olduğunda ve iş yükü büyük modelin yetenek tavanına ihtiyaç duymadığında 20b doğru kademedir.
Daha üst kademe çıkarıma yatırım yapıp yapmamaya karar vermeden önce istemler ve mimariler üzerinde hızlıca iterasyon yapmak istediğiniz geliştirme ve prototipleme iş akışları. 20b'nin daha düşük maliyeti ve daha hızlı yanıt süresi, bir uygulama oluşturmanın hızlı iterasyon aşaması için daha uygun seçenektir.
Nerede yetersiz kalıyor
Daha büyük parametre ölçeğinden fayda sağlayan karmaşık akıl yürütme görevleri. 20b, zor sorulara makul görünen yanıtlar üretecektir, ancak gpt-oss-120b modelinin yakaladığı incelikleri kaçıracaktır. Akıl yürütme derinliğinin önemli olduğu ve AB barındırmasının zorunlu olduğu iş yükleri için 120b daha doğru kademedir.
Önemli kapsamda kod sentezi. Anlamlı karmaşıklıkta bir algoritma yazmak, birbiriyle etkileşen birçok ilgiyi olan dolaşık bir fonksiyonu yeniden düzenlemek, önemsiz olmayan test paketleri üretmek. 20b küçük kapsamlı kodlamayı iyi ele alır, ancak kapsam büyüdükçe hata oranı tırmanır.
Sınır seviyesi yetenek iş yükleri. Hiçbir 20b modeli, tescilli sınır modellerin ulaştığı mutlak yetenek tavanıyla rekabet edemez. 20b hacim kademesidir, sınır kademesi değildir; gerçek anlamda sınır yeteneği gerektiren iş yükleri için kullanmak hayal kırıklığı yaratan çıktılar verir.
Çok modlu çalışma. Model yalnızca metindir. Görsel, ses veya çok modlu yetenek için OVH, aynı AB egemen barındırma deseni üzerinden görsel-dil çalışması için qwen2.5-vl-72b-instruct gibi başka model aileleri sunar.
Bunu seçmek mi yoksa üst kademeye çıkmak mı
Ölçeklenebilir bir maliyet profilinde OpenAI soyağacını isteyen, yüksek hacimli metin uygulamaları kuran AB müşterileri için OVH üzerindeki gpt-oss-20b doğru varsayılan seçenektir. Bu yapılandırma, 120b'nin eşleşemeyeceği birim ekonomisinde rutin metin iş yüklerinin büyük kısmını karşılar.
Yeteneğin maliyetten daha önemli olduğu iş yükleri için gpt-oss-120b, aynı soyağacı ve aynı barındırma ortamı içindeki yükseltmedir. Geçiş, API yüzeyinde önemsiz düzeydedir. Maliyet farkı anlamlıdır, dolayısıyla soru, iş yükünüzün gerçekten daha büyük modele ihtiyaç duyup duymadığıdır.
20b parametre ölçeğinde olup özellikle OpenAI soyağacına ihtiyaç duymayan iş yükleri için OVH güçlü alternatifler sunar. llama-3.1-8b-instruct aynı genel yetenek kademesinin daha küçük ucunda yer alır. mistral-small-3.2-24b-instruct-2506 benzer ölçekteki Avrupa kökenli alternatiftir. qwen3-32b ise yine AB egemen barındırma zarfı içinde, biraz daha yüksek parametre sayısında başka bir genel amaçlı seçenektir.
Gerçek sınır yeteneğine ihtiyaç duyan ve AB dışı barındırmayı kabul edebilen iş yükleri için, daha yeni akıl yürütme ve çok modlu modellerle doğrudan OpenAI API'si alternatif yoldur. AB egemen yetenekli çıkarım ile sınır yetenekli ABD merkezli çıkarım arasındaki seçim, bu modelin bilgilendirmek için var olduğu stratejik karardır.
Son teknik inceleme: 2026-05-22 — Tokonomix.ai
