Hangi dil görevlerinde öne çıkıyor?

Metin üretimi, soru-cevap, özetleme ve genel dil işleme görevlerinde güçlü performans sunuyor.

OVH altyapısının avantajı ne?

Avrupa merkezli hesaplama, düşük gecikme ve veri mahremiyeti uyumluluğu sağlıyor.

Parametre sayısının önemi nedir?

Büyük parametre sayısı daha derin bağlam anlama sağlar; kullanım senaryonuza göre doğru modeli seçin.

Seviye C — Uzman

Çalıştığı yer:FranceYapıldığı yer:United States

OVH AI Endpoints (GRA)

gpt-oss-120b

Seviye C — Uzman

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan·Yayınlandı 22 Mayıs 2026·Son inceleme 26 Mayıs 2026

GPT-OSS-120B, OVH AI Endpoints aracılığıyla sunulan ve şirketin GRA (Gravelines, Fransa) veri merkezi bölgesinde barındırılan büyük bir dil modelidir. Bu model, OVH'nin açık kaynaklı dil modeli altyapısını Avrupa bulut altyapısı üzerinde dağıtarak sunmasını temsil etmektedir. 120 milyar parametrelik ölçek, modeli metin üretimi, sohbet, analiz ve temel akıl yürütme dahil olmak üzere genel amaçlı doğal dil işleme görevlerini yerine getirebilecek kapsamlı bir model konumuna yerleştirmektedir. Model; tutarlı uzun biçimli içerik, soru yanıtlama, özetleme ve benzeri NLP iş yükleri gerektiren uygulamalara uygun standart metin üretimi yetenekleri sunmaktadır. Spesifik bağlam penceresi boyutu kamuya açık olarak belgelenmemiş olsa da model, bu parametre aralığındaki modeller için tipik olan geleneksel transformer mimarisi kalıplarını takip etmektedir. OVH AI Endpoints, bu modeli API altyapısı aracılığıyla sunarak geliştiricilerin temel hesaplama kaynaklarını yönetmeden büyük dil modeli yeteneklerini entegre etmesine olanak tanımaktadır. OVH'nin AI Endpoints portföyü içinde GPT-OSS-120B, Avrupa altyapısı dahilinde veri egemenliğini korurken kapsamlı dil işleme yetenekleri arayan müşterilere sunulan daha büyük açık kaynaklı model seçeneklerinden biri olarak hizmet vermektedir. GRA dağıtım konumu, Avrupa düzenlemeleri kapsamında veri ikamet gereksinimleri olan kullanıcılar için özellikle önemli olabilir. OVH'nin yaklaşımı, açık kaynaklı modellere mevcut bulut altyapısı aracılığıyla erişim sağlamaya odaklanarak Avrupa barındırma pazarındaki yerleşik konumundan yararlanırken tescilli model sağlayıcılarına bir alternatif sunmaktadır.

gpt-oss-120b ile kendi sorularını test et

Avrupa'da barındırılan bu model, GDPR uyumluluğu gerektiren kurumlar için güvenli bir seçenek sunuyor.
— Tokonomix benchmark özeti

Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme102 runs

Bölüm 02

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

Yaratıcı

Olgusal

100

Çok dilli

Akıl yürütme

Bölüm 03

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰

API tarifeleri — gpt-oss-120b

$0.0800 1M giriş token başına

$0.4000 1M çıkış token başına

≈ $0.0001 tipik konuşma başına (800 token)

Giriş vs çıkış fiyatı (1M token başına)

1M giriş token başına$0.0800

1M çıkış token başına$0.4000

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.0800

input / 1M

— stable

$0.4000

output / 1M

— stable

2026-06-142026-07-052026-07-19

Input

Output

Price change

⟳ synced weekly

Bölüm 04

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)315 / avg 709

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 05

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

GDPR uyumlu Avrupa altyapısıVeri egemenliği güvencesiGeniş parametre kapasitesiMetin üretimi ve özetlemeÇok turlu sohbet desteğiTalimat takibinde yüksek başarı

Zayıf yönler

Bölgesel altyapı gecikme değişkenliğiİnternet erişimi bulunmuyorGörsel işleme desteği yok

Bölüm 06

Yetenekler

ownedBy: OpenAI

Bölüm 07

Sık sorulan sorular

OVH GRA veri merkezinde barındırılan model, Avrupa veri egemenliği gereksinimlerini destekliyor.

OVH Avrupa altyapısı üzerindeki bu model, veri egemenliği açısından stratejik bir tercih.
— Tokonomix benchmark özeti

Bölüm 08

Kullanılabilirlik

Henüz ölçüm verisi yok

Bu model için kullanılabilirlik istatistiklerini göstermek için yeterli API çağrısı henüz kaydedilmedi. Veri, model canlı trafik almaya başlayınca görünür.

Bölüm 09

Tokonomix kıyaslama kararları

⚖️

Endorsed by 2 judges

Independent LLM judges evaluated this model on our weekly intelligence tests

cohere/command-a100/100 · 1 runs

1 correct0 partial0 wrong100% accuracy

claude-sonnet-4-594/100 · 52 runs

46 correct5 partial1 wrong88% accuracy

● 2026-07-19

gpt-oss-120b quality drops 6.1 points, latency improves 20%

The current benchmark window shows a notable quality decline for gpt-oss-120b, with the overall score falling from 99.6 to 93.5 points. This 6.1 point drop represents a shift from near-perfect performance to strong but less consistent output. The category composition changed significantly between windows, with the previous period testing multilingual, coding, and reasoning capabilities, while the current window focuses on coding and creative tasks. Coding performance remains excellent at 100, maintaining the model's strength in this domain. However, the creative category scored 87, suggesting room for improvement in generative tasks. On a positive note, latency improved substantially, with p50 response times decreasing from 4092ms to 3269ms, a 20% reduction that enhances user experience. The test run count decreased slightly from 5 to 4, which may affect statistical confidence. Users should expect faster responses and continued excellence in coding tasks, but may notice variability in other domains compared to the previous benchmark period. The quality regression warrants monitoring in future windows to determine whether this represents a temporary fluctuation or a sustained trend.

Quality

93.5

Latency p50

3,269 ms

Test runs

✗ Quality dropped 6.1 points✓ Latency improved 20%✓ Coding remains at 100✗ Creative performance at 87

Bölüm 10

Tam model profili

OVH gpt-oss-120b: OpenAI'ın açık ağırlıklı amiral gemisi AB egemen altyapısında barındırılıyor

OVH AI Endpoints, gpt-oss-120b'yi Gravelines (Fransa) veri merkezinden sunuyor. Asıl hikâye de bu kombinasyon. OpenAI, 120 milyar parametreli, açık ağırlıklı bir model yayımladı. OVH ise bu modelin çıkarımını, GDPR'a uyumlu doğal operasyonlar ve AB veri ikametgâhı garantileriyle birlikte Fransız altyapısı içinde barındırıyor. ABD merkezli çıkarım uç noktalarına trafik göndermek zorunda kalmadan kullanabilecekleri, yüksek yetenekli, OpenAI soyundan bir model bekleyen Avrupalı ekipler için açılan yol işte bu yapılandırma.

OpenAI ve OVH birlikteliği neden önemli

gpt-oss-120b'nin sunduğu yetenek profili, AB egemen barındırma altında mevcut olan diğer her şeye kıyasla OpenAI'ın sınırına en yakın olanı. Diğer sağlayıcılardan gelen açık ağırlıklı modeller karşılaştırmalarda rekabetçi olsa da OpenAI soyağacı, üretim sistemlerinin yıllardır kalibre ettiği talimat takibi alışkanlıklarını, yapılandırılmış çıktı güvenilirliğini ve muhakeme örüntülerini de beraberinde getiriyor. Farklı bir model ailesine geçiş, karşılaştırma puanları benzer görünse bile bedelsiz değil.

Fransa içinde OVH üzerinde barındırma, AB müşterilerinin gerçekten ihtiyaç duyduğu veri işleme sözleşmesi anlatısını size sağlıyor. Trafik Fransa sınırları içinde kalıyor. Operasyonlar Fransız ve Avrupa veri hukukuna tabi yürütülüyor. Müşterilerinizle yapacağınız DPA konuşması, Anthropic tarzı veri koruma şartları ne kadar iyileşirse iyileşsin ABD merkezli OpenAI uç noktalarını çağırırken hiçbir zaman tam olarak olmayan bir şekilde sade ve anlaşılır hale geliyor.

Bunun karşılığında, OpenAI'ın en son davranışından vazgeçiyorsunuz. gpt-oss-120b ağırlıkları sürekli güncellenen bir üretim modeli değil, sabit bir anlık görüntü. OpenAI kendi API'si üzerinden daha yeni muhakeme modelleri, görüntü modelleri ve çok modlu yetenekler sunmaya devam ediyor ve bunlar açık ağırlık sürümüne yansımıyor. Açık ağırlıklı 120b yeteneğinin yeterli olduğu iş yükleri için bu sorun değil. Sınır yetenekten medet uman iş yükleri için ise doğru araç bu değil.

Neyi iyi karşılıyor

Genel amaçlı metin üretimi, talimat takibi, yapılandırılmış çıktı, çok turlu diyalog. 120b parametre ölçeği; orta düzeyde karmaşık muhakemeyi, önemsiz olmayan kapsamda kod sentezini ve tutarlı yapıyla uzun biçim üretimi karşılayacak kadar büyük. Daha önce genel işler için GPT-4 sınıfı modellerde çalışan iş yüklerinin çoğu için gpt-oss-120b inanılır bir alternatif.

Çok dilli kapsama Avrupa dillerinde güçlü; bu da bu barındırma yapılandırmasının hedeflediği AB müşteri tabanı için önemli. Fransızca, Almanca, Felemenkçe, İspanyolca, İtalyanca, Portekizce ve Lehçe iyi çalışıyor. Model; çeviri, çok dilli müşteri desteği ve ABD'de barındırılan alternatiflerin çıktı tarzıyla zaman zaman Anglo-merkezli hissettiren dillerde içerik üretimi konusunda rahat.

OVH barındırması, öngörülebilir Avrupa gecikme süresi sunuyor. Gravelines veri merkezi, kıta Avrupası ve Birleşik Krallık'tan düşük gecikmeli erişim için iyi konumlanmış. Gecikme süresine duyarlı uygulamalar için gidiş-dönüş süresi, ABD'de barındırılan OpenAI uç noktalarına giden transatlantik rotalardan belirgin biçimde daha iyi.

Nerede yetersiz kalıyor

En zorlu iş yükleri için sınır yetenek açığı gerçek. Karmaşık çok adımlı muhakeme, o-serisi muhakeme modellerinin iyi karşıladığı türden kod sentezi, görüntü anlama ve üretimi, gerçek zamanlı ses etkileşimi. Bunların hiçbiri gpt-oss-120b tarafından ele alınmıyor. Bu iş yükleri için ya ABD merkezli barındırma yolunu kabul etmeniz ya da yüksek yeteneği farklı model aileleriyle AB barındırması altında birleştiren diğer sağlayıcılara bakmanız gerekiyor.

Model yalnızca metin üzerine. Görme yok, ses yok, çok modlu yetenek yok. Çok modlu iş yükleri için OVH, aynı uç nokta desenini kullanan Qwen2.5-VL gibi başka model aileleri sunuyor; ancak bunlar farklı davranış profillerine sahip farklı soyağaçları.

120b parametre ölçeği büyük ama mutlak yetenek tavanında değil. Gerçek anlamda sınır sınıfı bir modele ihtiyaç duyan iş yükleri farkı hissedecek. 120b zarfının içine rahatça oturan iş yükleri için fark önemli değil ve AB barındırma avantajı, ödünleşme hesabında baskın hale geliyor.

Seçimi ve değerlendirilecek diğer seçenekler

OpenAI soyağacını ve AB veri ikametgâhını isteyen, genel amaçlı metin uygulamaları geliştiren AB müşterileri için OVH üzerindeki gpt-oss-120b doğru varsayılan seçimdir. Bu yapılandırma; Avrupa kurumları ve kamu sektörü alıcıları için yıllardır tedarik açısından engel olan gerçek bir sorunu çözüyor.

Özellikle OpenAI soyağacına ihtiyaç duymayan iş yükleri için OVH'ın kataloğu, aynı barındırma zarfında güçlü alternatifler sunuyor. meta-llama-3_3-70b-instruct benzer yetenek katmanındaki Meta açık ağırlık seçeneği. mistral-small-3.2-24b-instruct-2506 ise AB egemen barındırmasını AB kökenli eğitimle birleştiren Avrupa kökenli bir model. qwen3-32b ise daha küçük parametre ölçeğinde ve daha düşük maliyetle güçlü bir genel amaçlı seçenek.

Aynı OpenAI açık ağırlık soyağacının daha küçük, daha hızlı ve daha ucuz bir varyantına ihtiyaç duyan iş yükleri için gpt-oss-20b küçük kardeşi konumunda. Gerçek sınır yeteneğine ihtiyaç duyan ve ABD'de barındırılan çıkarımı kabul edebilen iş yükleri için ise daha yeni muhakeme ve çok modlu modellere sahip doğrudan OpenAI API'si alternatif yoldur. Seçim, AB egemen barındırmasının katı bir gereklilik mi yoksa belirli yetenek ihtiyaçları için gevşetilebilecek bir tercih mi olduğuna bağlı.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Son otomatik test

30 Tem 2026 · 14:04 UTC · Hız testi

P50 gecikme

635 ms

P95 gecikme

1061 ms

Hatalar

0 / 6 çalıştırma

Son inceleyen Tokonomix Ekibi·26 Mayıs 2026