İçeriğe geç
Seviye C — Uzman
Çalıştığı yer:FranceYapıldığı yer:United States
OVH AI Endpoints (GRA)

gpt-oss-120b

Seviye C — Uzman

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··

GPT-OSS-120B, OVH AI Endpoints aracılığıyla sunulan ve şirketin GRA (Gravelines, Fransa) veri merkezi bölgesinde barındırılan büyük bir dil modelidir. Bu model, OVH'nin açık kaynaklı dil modeli altyapısını Avrupa bulut altyapısı üzerinde dağıtarak sunmasını temsil etmektedir. 120 milyar parametrelik ölçek, modeli metin üretimi, sohbet, analiz ve temel akıl yürütme dahil olmak üzere genel amaçlı doğal dil işleme görevlerini yerine getirebilecek kapsamlı bir model konumuna yerleştirmektedir. Model; tutarlı uzun biçimli içerik, soru yanıtlama, özetleme ve benzeri NLP iş yükleri gerektiren uygulamalara uygun standart metin üretimi yetenekleri sunmaktadır. Spesifik bağlam penceresi boyutu kamuya açık olarak belgelenmemiş olsa da model, bu parametre aralığındaki modeller için tipik olan geleneksel transformer mimarisi kalıplarını takip etmektedir. OVH AI Endpoints, bu modeli API altyapısı aracılığıyla sunarak geliştiricilerin temel hesaplama kaynaklarını yönetmeden büyük dil modeli yeteneklerini entegre etmesine olanak tanımaktadır. OVH'nin AI Endpoints portföyü içinde GPT-OSS-120B, Avrupa altyapısı dahilinde veri egemenliğini korurken kapsamlı dil işleme yetenekleri arayan müşterilere sunulan daha büyük açık kaynaklı model seçeneklerinden biri olarak hizmet vermektedir. GRA dağıtım konumu, Avrupa düzenlemeleri kapsamında veri ikamet gereksinimleri olan kullanıcılar için özellikle önemli olabilir. OVH'nin yaklaşımı, açık kaynaklı modellere mevcut bulut altyapısı aracılığıyla erişim sağlamaya odaklanarak Avrupa barındırma pazarındaki yerleşik konumundan yararlanırken tescilli model sağlayıcılarına bir alternatif sunmaktadır.

Avrupa'da barındırılan bu model, GDPR uyumluluğu gerektiren kurumlar için güvenli bir seçenek sunuyor.

Tokonomix benchmark özeti
Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme97 runs
138182235065190687405-2206-15ms
Bölüm 02

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

100
Kod üretimi
100
Çok dilli
100
Akıl yürütme
Bölüm 03

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — gpt-oss-120b
$0.0800 1M giriş token başına
$0.4000 1M çıkış token başına
≈ $0.0001 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$0.0800
1M çıkış token başına$0.4000

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.0800

input / 1M

— no change

$0.4000

output / 1M

— no change

2026-06-142026-06-142026-06-14
Input
Output
Price change
⟳ synced weekly
Bölüm 04

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)496 / avg 882
1429329

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 05

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

GDPR uyumlu Avrupa altyapısıVeri egemenliği güvencesiGeniş parametre kapasitesiMetin üretimi ve özetlemeÇok turlu sohbet desteğiTalimat takibinde yüksek başarı

Zayıf yönler

Bölgesel altyapı gecikme değişkenliğiİnternet erişimi bulunmuyorGörsel işleme desteği yok
Bölüm 06

Yetenekler

ownedBy: OpenAI
Bölüm 07

Sık sorulan sorular

OVH GRA veri merkezinde barındırılan model, Avrupa veri egemenliği gereksinimlerini destekliyor.

OVH Avrupa altyapısı üzerindeki bu model, veri egemenliği açısından stratejik bir tercih.

Tokonomix benchmark özeti
Bölüm 08

Kullanılabilirlik

Kullanılabilirlik

Henüz ölçüm verisi yok

Bu model için kullanılabilirlik istatistiklerini göstermek için yeterli API çağrısı henüz kaydedilmedi. Veri, model canlı trafik almaya başlayınca görünür.

Bölüm 09

Tokonomix kıyaslama kararları

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-595/100 · 13 runs
12 correct1 partial0 wrong92% accuracy
2026-06-14

gpt-oss-120b maintains strong baseline performance across all metrics

The gpt-oss-120b model by OVH AI Endpoints continues to demonstrate consistent performance across the benchmark window with no measurable changes to its core capabilities. The model maintains its established baseline metrics for quality, speed, and reliability. All performance indicators remain stable compared to the previous evaluation period, suggesting a mature and dependable deployment. Users can expect the same level of service quality that was observed during the initial baseline establishment. The model's performance characteristics have not shifted, indicating stable infrastructure and consistent model serving. This consistency is particularly relevant for users who have integrated the model into production workflows and require predictable behavior. While no improvements were detected during this window, the absence of degradation is itself a positive signal for reliability. The stability across metrics suggests that OVH AI Endpoints has maintained their service level without introducing changes that would impact model outputs or response characteristics. Users should continue to monitor future benchmark windows for any emerging trends or changes in performance patterns.

Quality

Latency p50

Test runs

0

Performance metrics remain stable Consistent baseline maintained
Bölüm 10

Tam model profili

gpt-oss-120b — illustration 1
OVH gpt-oss-120b: OpenAI'ın açık ağırlıklı amiral gemisi AB egemen altyapısında barındırılıyor

OVH AI Endpoints, gpt-oss-120b'yi Gravelines (Fransa) veri merkezinden sunuyor. Asıl hikâye de bu kombinasyon. OpenAI, 120 milyar parametreli, açık ağırlıklı bir model yayımladı. OVH ise bu modelin çıkarımını, GDPR'a uyumlu doğal operasyonlar ve AB veri ikametgâhı garantileriyle birlikte Fransız altyapısı içinde barındırıyor. ABD merkezli çıkarım uç noktalarına trafik göndermek zorunda kalmadan kullanabilecekleri, yüksek yetenekli, OpenAI soyundan bir model bekleyen Avrupalı ekipler için açılan yol işte bu yapılandırma.

OpenAI ve OVH birlikteliği neden önemli

gpt-oss-120b'nin sunduğu yetenek profili, AB egemen barındırma altında mevcut olan diğer her şeye kıyasla OpenAI'ın sınırına en yakın olanı. Diğer sağlayıcılardan gelen açık ağırlıklı modeller karşılaştırmalarda rekabetçi olsa da OpenAI soyağacı, üretim sistemlerinin yıllardır kalibre ettiği talimat takibi alışkanlıklarını, yapılandırılmış çıktı güvenilirliğini ve muhakeme örüntülerini de beraberinde getiriyor. Farklı bir model ailesine geçiş, karşılaştırma puanları benzer görünse bile bedelsiz değil.

Fransa içinde OVH üzerinde barındırma, AB müşterilerinin gerçekten ihtiyaç duyduğu veri işleme sözleşmesi anlatısını size sağlıyor. Trafik Fransa sınırları içinde kalıyor. Operasyonlar Fransız ve Avrupa veri hukukuna tabi yürütülüyor. Müşterilerinizle yapacağınız DPA konuşması, Anthropic tarzı veri koruma şartları ne kadar iyileşirse iyileşsin ABD merkezli OpenAI uç noktalarını çağırırken hiçbir zaman tam olarak olmayan bir şekilde sade ve anlaşılır hale geliyor.

Bunun karşılığında, OpenAI'ın en son davranışından vazgeçiyorsunuz. gpt-oss-120b ağırlıkları sürekli güncellenen bir üretim modeli değil, sabit bir anlık görüntü. OpenAI kendi API'si üzerinden daha yeni muhakeme modelleri, görüntü modelleri ve çok modlu yetenekler sunmaya devam ediyor ve bunlar açık ağırlık sürümüne yansımıyor. Açık ağırlıklı 120b yeteneğinin yeterli olduğu iş yükleri için bu sorun değil. Sınır yetenekten medet uman iş yükleri için ise doğru araç bu değil.

Neyi iyi karşılıyor

Genel amaçlı metin üretimi, talimat takibi, yapılandırılmış çıktı, çok turlu diyalog. 120b parametre ölçeği; orta düzeyde karmaşık muhakemeyi, önemsiz olmayan kapsamda kod sentezini ve tutarlı yapıyla uzun biçim üretimi karşılayacak kadar büyük. Daha önce genel işler için GPT-4 sınıfı modellerde çalışan iş yüklerinin çoğu için gpt-oss-120b inanılır bir alternatif.

Çok dilli kapsama Avrupa dillerinde güçlü; bu da bu barındırma yapılandırmasının hedeflediği AB müşteri tabanı için önemli. Fransızca, Almanca, Felemenkçe, İspanyolca, İtalyanca, Portekizce ve Lehçe iyi çalışıyor. Model; çeviri, çok dilli müşteri desteği ve ABD'de barındırılan alternatiflerin çıktı tarzıyla zaman zaman Anglo-merkezli hissettiren dillerde içerik üretimi konusunda rahat.

OVH barındırması, öngörülebilir Avrupa gecikme süresi sunuyor. Gravelines veri merkezi, kıta Avrupası ve Birleşik Krallık'tan düşük gecikmeli erişim için iyi konumlanmış. Gecikme süresine duyarlı uygulamalar için gidiş-dönüş süresi, ABD'de barındırılan OpenAI uç noktalarına giden transatlantik rotalardan belirgin biçimde daha iyi.

Nerede yetersiz kalıyor

En zorlu iş yükleri için sınır yetenek açığı gerçek. Karmaşık çok adımlı muhakeme, o-serisi muhakeme modellerinin iyi karşıladığı türden kod sentezi, görüntü anlama ve üretimi, gerçek zamanlı ses etkileşimi. Bunların hiçbiri gpt-oss-120b tarafından ele alınmıyor. Bu iş yükleri için ya ABD merkezli barındırma yolunu kabul etmeniz ya da yüksek yeteneği farklı model aileleriyle AB barındırması altında birleştiren diğer sağlayıcılara bakmanız gerekiyor.

Model yalnızca metin üzerine. Görme yok, ses yok, çok modlu yetenek yok. Çok modlu iş yükleri için OVH, aynı uç nokta desenini kullanan Qwen2.5-VL gibi başka model aileleri sunuyor; ancak bunlar farklı davranış profillerine sahip farklı soyağaçları.

120b parametre ölçeği büyük ama mutlak yetenek tavanında değil. Gerçek anlamda sınır sınıfı bir modele ihtiyaç duyan iş yükleri farkı hissedecek. 120b zarfının içine rahatça oturan iş yükleri için fark önemli değil ve AB barındırma avantajı, ödünleşme hesabında baskın hale geliyor.

Seçimi ve değerlendirilecek diğer seçenekler

OpenAI soyağacını ve AB veri ikametgâhını isteyen, genel amaçlı metin uygulamaları geliştiren AB müşterileri için OVH üzerindeki gpt-oss-120b doğru varsayılan seçimdir. Bu yapılandırma; Avrupa kurumları ve kamu sektörü alıcıları için yıllardır tedarik açısından engel olan gerçek bir sorunu çözüyor.

Özellikle OpenAI soyağacına ihtiyaç duymayan iş yükleri için OVH'ın kataloğu, aynı barındırma zarfında güçlü alternatifler sunuyor. meta-llama-3_3-70b-instruct benzer yetenek katmanındaki Meta açık ağırlık seçeneği. mistral-small-3.2-24b-instruct-2506 ise AB egemen barındırmasını AB kökenli eğitimle birleştiren Avrupa kökenli bir model. qwen3-32b ise daha küçük parametre ölçeğinde ve daha düşük maliyetle güçlü bir genel amaçlı seçenek.

Aynı OpenAI açık ağırlık soyağacının daha küçük, daha hızlı ve daha ucuz bir varyantına ihtiyaç duyan iş yükleri için gpt-oss-20b küçük kardeşi konumunda. Gerçek sınır yeteneğine ihtiyaç duyan ve ABD'de barındırılan çıkarımı kabul edebilen iş yükleri için ise daha yeni muhakeme ve çok modlu modellere sahip doğrudan OpenAI API'si alternatif yoldur. Seçim, AB egemen barındırmasının katı bir gereklilik mi yoksa belirli yetenek ihtiyaçları için gevşetilebilecek bir tercih mi olduğuna bağlı.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

gpt-oss-120b — illustration 2
Son otomatik test
15 Haz 2026 · 08:00 UTC · Hız testi
P50 gecikme
403 ms
P95 gecikme
541 ms
Hatalar
0 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·26 Mayıs 2026