İçeriğe geç
Seviye C — Uzman
Çalıştığı yer:FranceYapıldığı yer:China
OVH AI Endpoints (GRA)

Qwen2.5-VL-72B-Instruct

Seviye C — Uzman

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··

Qwen2.5-VL-72B-Instruct, Alibaba Cloud'un Qwen ekibi tarafından geliştirilen ve OVH AI Endpoints aracılığıyla Gravelines (GRA) veri merkezi bölgesinde sunulan büyük ölçekli bir görsel-dil modelidir. Bu model Qwen 2.5 serisine aittir ve hem metin hem de görsel girdileri işleyebilen çok modlu, talimat ayarlı bir varyantı temsil eder. 72 milyar parametreye sahip olan model, metinsel ve görsel bilgi arasındaki ilişkileri anlamayı gerektiren karmaşık muhakeme görevleri için tasarlanmış yüksek kapasiteli bir model olarak konumlandırılmıştır. Model, görsel açıklama oluşturma, görsel soru yanıtlama, doküman anlama ve çok modlu muhakeme gibi görsel-dil görevleri için optimize edilmiştir. Talimat ayarlı yapısı, kullanıcı komutlarını takip etmek ve birleşik metin ve görsel girdilere dayalı tutarlı, bağlamsal olarak uygun yanıtlar üretmek için özel olarak ince ayar yapıldığı anlamına gelir. Model, görsel anlama işlevlerinin yanı sıra standart metin üretme yeteneklerini de destekleyerek her iki modaliteyi de gerektiren uygulamalar için çok yönlü hale gelir. OVH'nin AI Endpoints hizmeti kapsamında Qwen2.5-VL-72B-Instruct, yönetilen bir çıkarım uç noktası olarak hizmet verir ve geliştiricilerin altyapı yönetimi yapmadan modelin yeteneklerine erişmesini sağlar. OVH bu modeli Avrupa veri merkezlerinde barındırarak, veri yerleşimi gereksinimleri olan kuruluşlar için bölgesel dağıtım seçenekleri sunar. Bağlam penceresi spesifikasyonu kamuya açık dokümantasyonda belirtilmemiş olsa da, bu sınıftaki modeller genellikle birleşik metin ve görsel işleme görevleri için birkaç bin token destekler.

Avrupa'da barındırılan bu model, GDPR uyumluluğu gerektiren kurumlar için güvenli bir seçenek sunuyor.

Tokonomix benchmark özeti
Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme69 runs
86794015793236473150005-1105-27ms
Bölüm 02

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — Qwen2.5-VL-72B-Instruct
$0.1500 1M giriş token başına
$0.4500 1M çıkış token başına
≈ $0.0002 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$0.1500
1M çıkış token başına$0.4500

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.1500

input / 1M

— no change

$0.4500

output / 1M

— no change

2026-05-242026-05-242026-05-24
Input
Output
Price change
⟳ synced weekly
Bölüm 03

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)1852 / avg 1404
22925

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 04

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

Görsel ve metin birlikte anlamaGDPR uyumlu Avrupa altyapısıVeri egemenliği güvencesiGeniş parametre kapasitesiMetin üretimi ve özetlemeÇok turlu sohbet desteği

Zayıf yönler

Bölgesel altyapı gecikme değişkenliğiBüyük model yüksek çıkarım maliyetiİnternet erişimi bulunmuyor
Bölüm 05

Yetenekler

ownedBy: Qwen
Bölüm 06

Sık sorulan sorular

OVH GRA veri merkezinde barındırılan model, Avrupa veri egemenliği gereksinimlerini destekliyor.

OVH Avrupa altyapısı üzerindeki bu model, veri egemenliği açısından stratejik bir tercih.

Tokonomix benchmark özeti
Bölüm 07

Tokonomix kıyaslama kararları

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-595/100 · 5 runs
5 correct0 partial0 wrong100% accuracy
2026-05-24

Qwen2.5-VL-72B-Instruct, GRA uç noktasında temel performansı belirliyor

Bu değerlendirme, OVH AI Endpoints'in GRA bölgesinde konuşlandırılan Qwen2.5-VL-72B-Instruct için temel performans profilini ortaya koymaktadır. 72 milyar parametreli bir görsel-dil modeli olarak bu endpoint, Qwen'in hem metin hem de görüntü girdilerini işleyebilen büyük ölçekli çok kipli sunumunu temsil etmektedir. Model, görsel ve metinsel bilginin eş zamanlı anlaşılmasını gerektiren karmaşık görevleri ele almak için tasarlanan görsel-dil modellerinin büyüyen ekosistemine katılmaktadır. Bu ilk kıyaslama penceresi olduğu için, performans eğilimlerini, güvenilirlik örüntülerini veya zaman içindeki kalite metriklerini değerlendirecek karşılaştırmalı verimiz bulunmamaktadır. Kullanıcılar, bunun bu altyapı üzerindeki birinci nesil bir dağıtım olduğunu ve sonraki kıyaslama pencerelerinin yanıt tutarlılığı, verim kararlılığı ve çeşitli yük koşullarında kalite sürekliliği gibi önemli özellikleri ortaya koyacağını göz önünde bulundurmalıdır. GRA bölgesi dağıtımı, bölgesel uyumluluk gerektiren kullanıcılar için Avrupa veri ikametgâhına işaret etmektedir. Gelecekteki değerlendirmeler, endpoint'in istikrarlı performans özelliklerini koruyup korumadığını ve doğruluk, gecikme ile operasyonel güvenilirlik açısından alternatif görsel-dil modeli dağıtımlarıyla nasıl karşılaştırıldığını takip edecektir.

Quality

Latency p50

Test runs

0

Takip için temel referans oluşturuldu
Bölüm 08

Tam model profili

qwen2.5-vl-72b-instruct — illustration 1
OVH AI Endpoints üzerinde Qwen2.5-VL 72B Instruct

Qwen2.5-VL 72B Instruct, Alibaba'nın Qwen2.5 neslinden ağır siklet görüntü-dil modelidir. Metin ve görüntü girdisi alır ve metin döndürür. OVH AI Endpoints, çıkarımı Fransa veri merkezlerinde barındırıyor ve bu, Avrupalı üretim ekipleri için bu listelemenin en ilgi çekici yönü: bu ölçekte ciddi bir görüntü modeli, AB ikamet korumasıyla birlikte.

Ne yapar

Model, tek bir istekte metin ile birlikte görüntüler kabul eder ve metin çıktısı üretir. Pratik girdiler arasında ekran görüntüleri, taranmış belgeler, fiziksel nesnelerin fotoğrafları, grafikler, diyagramlar, kullanıcı arayüzü maketleri ve videodan çekilen kareler bulunur. Gördüklerini tanımlayabilir, belgelerden yapılandırılmış veri çıkarabilir, bir görüntüye dayalı soruları yanıtlayabilir ve düzenler ile görsel ilişkiler hakkında akıl yürütebilir.

Belge odaklı işler için model, faturalar, formlar, tablolar, makbuzlar ve benzer yapılandırılmış materyalleri üstünde bir doğrulayıcı ile üretimde kullanılabilir bir kalitede işler. Doğal görüntüler için iyi tanımlamalar üretir ve içerik hakkındaki soruları denetleme, erişilebilirlik ve arama etiketleme iş akışları için yeterince güvenilir şekilde yanıtlar. Diyagram anlayışı, standart iş grafikleri türleri için sağlamdır.

Yalnızca metin istemler de iyi çalışır. Model, Qwen2.5 serisinin geri kalanıyla aynı talimat ayarlı sohbet davranışına sahiptir, dolayısıyla ayrı bir uç nokta başlatmadan bazen görüntü içeren ve bazen içermeyen karma iş akışları için kullanabilirsiniz.

Nerede iyi performans gösterir

Belge çıkarımı en güçlü pratik kullanım durumudur. Yüklenen PDF'leri veya fotoğraflanmış makbuzları alan ve satır öğelerini, tarihleri, toplamları veya herhangi bir yapılandırılmış bilgiyi çekmesi gereken bir hattınız varsa, Qwen2.5-VL 72B, AB'de barındırılan kategorisindeki güvenilir seçeneklerden biridir.

Metin tarafında çok dilli işleme kapsamı geniştir. Qwen modelleri geleneksel olarak Çince ve büyük Avrupa dillerini, artı değişken kalitede uzun bir diğer diller listesini iyi kapsar. Latin alfabesi dışındaki belgelerde OCR benzeri davranış, birçok alternatiften daha iyi dayanır.

Gecikme, görüntüleri işleyen 72B modelinden beklediğiniz düzeydedir. Hızlı değil, acı verici şekilde yavaş da değil. Akışlı metin çıktısı, görüntü işleme tamamlandığında etkileşimli oturumların duyarlı hissedilmesini sağlar.

Nerede yetersiz kalır

Görüntü kalitesi çok önemlidir. Temiz, iyi aydınlatılmış, odaklanmış girdiler iyi çalışır. Açılardan çekilmiş bulanık telefon fotoğrafları, kötü sıkıştırılmış taramalar veya düşük kontrastlı belgeler, çıkarım kalitesinde anlamlı bir düşüş üretecektir. Gerçek dünya girdileriniz kaba eğilim gösteriyorsa, bir ön işleme adımı veya insan inceleme katmanı planlayın.

Model, piksel mükemmel metin yakalama gereksinim olduğunda özel OCR'nin yerini tutmaz. Kaba metin çıkarımı artı karma anlamsal anlama için mükemmeldir. Yoğun belgelerde birebir karakter bazında OCR için, uygun bir OCR motoruyla eşleştirin ve Qwen2.5-VL'yi akıl yürütme katmanı için kullanın.

Video girdisi, tek bir akış olarak doğal olarak işlenmez. Kareleri ayrı görüntüler olarak besleyebilir ve modelden bunlar üzerinden akıl yürütmesini isteyebilirsiniz, ancak bu, doğal video desteğine sahip bir modelden elde edeceğiniz zamansal akıl yürütme ile aynı şey değildir.

Araç çağırma, OpenAI uyumlu API yüzeyi aracılığıyla kullanılabilir. Şemayı istemde dikkatlice kısıtladığınızda JSON çıktısı güvenilirdir.

AB ikamet açısı

Bu ölçekte AB'de barındırılan görüntü modelleri yaygın değildir. OVH'nin buradaki sunumu somuttur: çıkarım Fransız topraklarında gerçekleşir, müşteri istemleri üzerinde eğitim yoktur, DPA Avrupalı bir tedarik ekibinin imzalayabileceği türdendir. Düzenlenmiş belgelerin, kişisel kimlik bilgilerinin veya hassas materyalin görüntülerini işleyen herhangi bir iş akışı için, ikamet hikayesi bu uç noktanın kısa listede olmasının tek nedenidir.

Bu slottaki alternatifler, daha güçlü genel yeteneğe sahip ancak daha zayıf ikamet duruşuna sahip ABD barındırmalı görüntü API'leri olma eğilimindedir. Bu ödünleşmenin hangi tarafının doğru olduğu, ne işlediğinize ve kimin imzalaması gerektiğine bağlıdır.

Fiyatlandırma

OVH AI Endpoints sayfasında listelenmiştir. Görüntü yeteneğine sahip 72B sınıfı modeller, beklediğiniz gibi daha küçük yalnızca metin modellerinden anlamlı derecede daha yüksek çağrı başına maliyetler taşır. Fiyatları yeniden yayınlamıyoruz.

Qwen2.5-VL 72B'yi alternatiflere karşı seçmek

Görüntü artı AB ikametine ihtiyacınız varsa: bunu kısa listeye alın. Görüntüye ihtiyacınız var ve ABD barındırmayı tolere edebiliyorsanız: katalog genişler. Yalnızca metne ihtiyacınız var ve bugün görüntü yeteneğine ihtiyacınız yoksa: daha düşük maliyetle yalnızca metin modeli seçin. En üst düzey görüntü kalitesine ihtiyacınız var ve ikamet sizi bağlamıyorsa: özellikle yüksek hacimli belge yapay zekası için başka yerlerde daha güçlü seçenekler var.

İstemleriniz üzerinde gerçek dünya testi için, metodoloji sayfası neyi değerlendirdiğimizi kapsar; zeka ve lider tablosu alternatiflere karşı güncel puanları taşır.

Sonuç

Fransız altyapısı üzerinde ağır siklet görüntü-dil modeli. Qwen2.5-VL 72B, ciddi belge ve görüntü işi için AB'de barındırılan yanıttır. 2026'da piyasadaki en güçlü görüntü modeli değildir. İkamet özetin bir parçası olduğunda en kullanışlı olanlardan biridir.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

qwen2.5-vl-72b-instruct — illustration 2qwen2.5-vl-72b-instruct — illustration 3
Son otomatik test
27 May 2026 · 21:44 UTC · Hız testi
P50 gecikme
108 ms
P95 gecikme
136 ms
Hatalar
0 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·26 Mayıs 2026