Hangi dil görevlerinde öne çıkıyor?

Metin üretimi, soru-cevap, özetleme ve genel dil işleme görevlerinde güçlü performans sunuyor.

OVH altyapısının avantajı ne?

Avrupa merkezli hesaplama, düşük gecikme ve veri mahremiyeti uyumluluğu sağlıyor.

Parametre sayısının önemi nedir?

Büyük parametre sayısı daha derin bağlam anlama sağlar; kullanım senaryonuza göre doğru modeli seçin.

Seviye C — Uzman

Çalıştığı yer:FranceYapıldığı yer:China

OVH AI Endpoints (GRA)

Qwen2.5-VL-72B-Instruct

Seviye C — Uzman

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan·Yayınlandı 22 Mayıs 2026·Son inceleme 26 Mayıs 2026

Qwen2.5-VL-72B-Instruct, Alibaba Cloud'un Qwen ekibi tarafından geliştirilen ve OVH AI Endpoints aracılığıyla Gravelines (GRA) veri merkezi bölgesinde sunulan büyük ölçekli bir görsel-dil modelidir. Bu model Qwen 2.5 serisine aittir ve hem metin hem de görsel girdileri işleyebilen çok modlu, talimat ayarlı bir varyantı temsil eder. 72 milyar parametreye sahip olan model, metinsel ve görsel bilgi arasındaki ilişkileri anlamayı gerektiren karmaşık muhakeme görevleri için tasarlanmış yüksek kapasiteli bir model olarak konumlandırılmıştır. Model, görsel açıklama oluşturma, görsel soru yanıtlama, doküman anlama ve çok modlu muhakeme gibi görsel-dil görevleri için optimize edilmiştir. Talimat ayarlı yapısı, kullanıcı komutlarını takip etmek ve birleşik metin ve görsel girdilere dayalı tutarlı, bağlamsal olarak uygun yanıtlar üretmek için özel olarak ince ayar yapıldığı anlamına gelir. Model, görsel anlama işlevlerinin yanı sıra standart metin üretme yeteneklerini de destekleyerek her iki modaliteyi de gerektiren uygulamalar için çok yönlü hale gelir. OVH'nin AI Endpoints hizmeti kapsamında Qwen2.5-VL-72B-Instruct, yönetilen bir çıkarım uç noktası olarak hizmet verir ve geliştiricilerin altyapı yönetimi yapmadan modelin yeteneklerine erişmesini sağlar. OVH bu modeli Avrupa veri merkezlerinde barındırarak, veri yerleşimi gereksinimleri olan kuruluşlar için bölgesel dağıtım seçenekleri sunar. Bağlam penceresi spesifikasyonu kamuya açık dokümantasyonda belirtilmemiş olsa da, bu sınıftaki modeller genellikle birleşik metin ve görsel işleme görevleri için birkaç bin token destekler.

Qwen2.5-VL-72B-Instruct ile kendi sorularını test et

Avrupa'da barındırılan bu model, GDPR uyumluluğu gerektiren kurumlar için güvenli bir seçenek sunuyor.
— Tokonomix benchmark özeti

Bölüm 01

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰

API tarifeleri — Qwen2.5-VL-72B-Instruct

$0.1500 1M giriş token başına

$0.4500 1M çıkış token başına

≈ $0.0002 tipik konuşma başına (800 token)

Giriş vs çıkış fiyatı (1M token başına)

1M giriş token başına$0.1500

1M çıkış token başına$0.4500

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.1500

input / 1M

— no change

$0.4500

output / 1M

— no change

2026-05-242026-05-242026-05-24

Input

Output

Price change

⟳ synced weekly

Bölüm 02

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

Görsel ve metin birlikte anlamaGDPR uyumlu Avrupa altyapısıVeri egemenliği güvencesiGeniş parametre kapasitesiMetin üretimi ve özetlemeÇok turlu sohbet desteği

Zayıf yönler

Bölgesel altyapı gecikme değişkenliğiBüyük model yüksek çıkarım maliyetiİnternet erişimi bulunmuyor

Bölüm 03

Yetenekler

ownedBy: Qwen

Bölüm 04

Sık sorulan sorular

OVH GRA veri merkezinde barındırılan model, Avrupa veri egemenliği gereksinimlerini destekliyor.

OVH Avrupa altyapısı üzerindeki bu model, veri egemenliği açısından stratejik bir tercih.
— Tokonomix benchmark özeti

Bölüm 05

Kullanılabilirlik

Henüz ölçüm verisi yok

Bu model için kullanılabilirlik istatistiklerini göstermek için yeterli API çağrısı henüz kaydedilmedi. Veri, model canlı trafik almaya başlayınca görünür.

Bölüm 06

Tokonomix kıyaslama kararları

⚖️

Endorsed by 1 judge

Independent LLM judges evaluated this model on our weekly intelligence tests

claude-sonnet-4-595/100 · 5 runs

5 correct0 partial0 wrong100% accuracy

● 2026-05-24

Qwen2.5-VL-72B-Instruct, GRA uç noktasında temel performansı belirliyor

Bu değerlendirme, OVH AI Endpoints'in GRA bölgesinde konuşlandırılan Qwen2.5-VL-72B-Instruct için temel performans profilini ortaya koymaktadır. 72 milyar parametreli bir görsel-dil modeli olarak bu endpoint, Qwen'in hem metin hem de görüntü girdilerini işleyebilen büyük ölçekli çok kipli sunumunu temsil etmektedir. Model, görsel ve metinsel bilginin eş zamanlı anlaşılmasını gerektiren karmaşık görevleri ele almak için tasarlanan görsel-dil modellerinin büyüyen ekosistemine katılmaktadır. Bu ilk kıyaslama penceresi olduğu için, performans eğilimlerini, güvenilirlik örüntülerini veya zaman içindeki kalite metriklerini değerlendirecek karşılaştırmalı verimiz bulunmamaktadır. Kullanıcılar, bunun bu altyapı üzerindeki birinci nesil bir dağıtım olduğunu ve sonraki kıyaslama pencerelerinin yanıt tutarlılığı, verim kararlılığı ve çeşitli yük koşullarında kalite sürekliliği gibi önemli özellikleri ortaya koyacağını göz önünde bulundurmalıdır. GRA bölgesi dağıtımı, bölgesel uyumluluk gerektiren kullanıcılar için Avrupa veri ikametgâhına işaret etmektedir. Gelecekteki değerlendirmeler, endpoint'in istikrarlı performans özelliklerini koruyup korumadığını ve doğruluk, gecikme ile operasyonel güvenilirlik açısından alternatif görsel-dil modeli dağıtımlarıyla nasıl karşılaştırıldığını takip edecektir.

Quality

—

Latency p50

—

Test runs

✓ Takip için temel referans oluşturuldu

Bölüm 07

Tam model profili

OVH AI Endpoints üzerinde Qwen2.5-VL 72B Instruct

Qwen2.5-VL 72B Instruct, Alibaba'nın Qwen2.5 neslinden ağır siklet görüntü-dil modelidir. Metin ve görüntü girdisi alır ve metin döndürür. OVH AI Endpoints, çıkarımı Fransa veri merkezlerinde barındırıyor ve bu, Avrupalı üretim ekipleri için bu listelemenin en ilgi çekici yönü: bu ölçekte ciddi bir görüntü modeli, AB ikamet korumasıyla birlikte.

Ne yapar

Model, tek bir istekte metin ile birlikte görüntüler kabul eder ve metin çıktısı üretir. Pratik girdiler arasında ekran görüntüleri, taranmış belgeler, fiziksel nesnelerin fotoğrafları, grafikler, diyagramlar, kullanıcı arayüzü maketleri ve videodan çekilen kareler bulunur. Gördüklerini tanımlayabilir, belgelerden yapılandırılmış veri çıkarabilir, bir görüntüye dayalı soruları yanıtlayabilir ve düzenler ile görsel ilişkiler hakkında akıl yürütebilir.

Belge odaklı işler için model, faturalar, formlar, tablolar, makbuzlar ve benzer yapılandırılmış materyalleri üstünde bir doğrulayıcı ile üretimde kullanılabilir bir kalitede işler. Doğal görüntüler için iyi tanımlamalar üretir ve içerik hakkındaki soruları denetleme, erişilebilirlik ve arama etiketleme iş akışları için yeterince güvenilir şekilde yanıtlar. Diyagram anlayışı, standart iş grafikleri türleri için sağlamdır.

Yalnızca metin istemler de iyi çalışır. Model, Qwen2.5 serisinin geri kalanıyla aynı talimat ayarlı sohbet davranışına sahiptir, dolayısıyla ayrı bir uç nokta başlatmadan bazen görüntü içeren ve bazen içermeyen karma iş akışları için kullanabilirsiniz.

Nerede iyi performans gösterir

Belge çıkarımı en güçlü pratik kullanım durumudur. Yüklenen PDF'leri veya fotoğraflanmış makbuzları alan ve satır öğelerini, tarihleri, toplamları veya herhangi bir yapılandırılmış bilgiyi çekmesi gereken bir hattınız varsa, Qwen2.5-VL 72B, AB'de barındırılan kategorisindeki güvenilir seçeneklerden biridir.

Metin tarafında çok dilli işleme kapsamı geniştir. Qwen modelleri geleneksel olarak Çince ve büyük Avrupa dillerini, artı değişken kalitede uzun bir diğer diller listesini iyi kapsar. Latin alfabesi dışındaki belgelerde OCR benzeri davranış, birçok alternatiften daha iyi dayanır.

Gecikme, görüntüleri işleyen 72B modelinden beklediğiniz düzeydedir. Hızlı değil, acı verici şekilde yavaş da değil. Akışlı metin çıktısı, görüntü işleme tamamlandığında etkileşimli oturumların duyarlı hissedilmesini sağlar.

Nerede yetersiz kalır

Görüntü kalitesi çok önemlidir. Temiz, iyi aydınlatılmış, odaklanmış girdiler iyi çalışır. Açılardan çekilmiş bulanık telefon fotoğrafları, kötü sıkıştırılmış taramalar veya düşük kontrastlı belgeler, çıkarım kalitesinde anlamlı bir düşüş üretecektir. Gerçek dünya girdileriniz kaba eğilim gösteriyorsa, bir ön işleme adımı veya insan inceleme katmanı planlayın.

Model, piksel mükemmel metin yakalama gereksinim olduğunda özel OCR'nin yerini tutmaz. Kaba metin çıkarımı artı karma anlamsal anlama için mükemmeldir. Yoğun belgelerde birebir karakter bazında OCR için, uygun bir OCR motoruyla eşleştirin ve Qwen2.5-VL'yi akıl yürütme katmanı için kullanın.

Video girdisi, tek bir akış olarak doğal olarak işlenmez. Kareleri ayrı görüntüler olarak besleyebilir ve modelden bunlar üzerinden akıl yürütmesini isteyebilirsiniz, ancak bu, doğal video desteğine sahip bir modelden elde edeceğiniz zamansal akıl yürütme ile aynı şey değildir.

Araç çağırma, OpenAI uyumlu API yüzeyi aracılığıyla kullanılabilir. Şemayı istemde dikkatlice kısıtladığınızda JSON çıktısı güvenilirdir.

AB ikamet açısı

Bu ölçekte AB'de barındırılan görüntü modelleri yaygın değildir. OVH'nin buradaki sunumu somuttur: çıkarım Fransız topraklarında gerçekleşir, müşteri istemleri üzerinde eğitim yoktur, DPA Avrupalı bir tedarik ekibinin imzalayabileceği türdendir. Düzenlenmiş belgelerin, kişisel kimlik bilgilerinin veya hassas materyalin görüntülerini işleyen herhangi bir iş akışı için, ikamet hikayesi bu uç noktanın kısa listede olmasının tek nedenidir.

Bu slottaki alternatifler, daha güçlü genel yeteneğe sahip ancak daha zayıf ikamet duruşuna sahip ABD barındırmalı görüntü API'leri olma eğilimindedir. Bu ödünleşmenin hangi tarafının doğru olduğu, ne işlediğinize ve kimin imzalaması gerektiğine bağlıdır.

Fiyatlandırma

OVH AI Endpoints sayfasında listelenmiştir. Görüntü yeteneğine sahip 72B sınıfı modeller, beklediğiniz gibi daha küçük yalnızca metin modellerinden anlamlı derecede daha yüksek çağrı başına maliyetler taşır. Fiyatları yeniden yayınlamıyoruz.

Qwen2.5-VL 72B'yi alternatiflere karşı seçmek

Görüntü artı AB ikametine ihtiyacınız varsa: bunu kısa listeye alın. Görüntüye ihtiyacınız var ve ABD barındırmayı tolere edebiliyorsanız: katalog genişler. Yalnızca metne ihtiyacınız var ve bugün görüntü yeteneğine ihtiyacınız yoksa: daha düşük maliyetle yalnızca metin modeli seçin. En üst düzey görüntü kalitesine ihtiyacınız var ve ikamet sizi bağlamıyorsa: özellikle yüksek hacimli belge yapay zekası için başka yerlerde daha güçlü seçenekler var.

İstemleriniz üzerinde gerçek dünya testi için, metodoloji sayfası neyi değerlendirdiğimizi kapsar; zeka ve lider tablosu alternatiflere karşı güncel puanları taşır.

Sonuç

Fransız altyapısı üzerinde ağır siklet görüntü-dil modeli. Qwen2.5-VL 72B, ciddi belge ve görüntü işi için AB'de barındırılan yanıttır. 2026'da piyasadaki en güçlü görüntü modeli değildir. İkamet özetin bir parçası olduğunda en kullanışlı olanlardan biridir.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Son otomatik test

27 May 2026 · 21:44 UTC · Hız testi

P50 gecikme

108 ms

P95 gecikme

136 ms

Hatalar

0 / 6 çalıştırma

Son inceleyen Tokonomix Ekibi·26 Mayıs 2026