İçeriğe geç
Seviye C — Uzman
Çalıştığı yer:USYapıldığı yer:United States
OpenAI

gpt-4o

Seviye C — Uzman · 128K token

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··

GPT-4o, OpenAI tarafından geliştirilen ve Mayıs 2024'te GPT-4 ailesinin bir parçası olarak yayımlanan çok modlu bir büyük dil modelidir. "o" eki, modelin "omni" yeteneklerine atıfta bulunur ve birleşik bir model mimarisi içinde metin, görüntü ve sesin işlenmesi ile üretilmesi için yerel destek sunduğunu belirtir. Bu model, OpenAI'nin ayrı uzmanlaşmış modellere bağımlı kalmak yerine birden fazla modaliteyi aynı anda işleyebilen daha entegre yapay zeka sistemleri oluşturma çabasını temsil eder. Model, 128,000 token'lık bir bağlam penceresine sahiptir; bu da tek bir istekte yaklaşık 96,000 kelime veya 300 sayfa metin işleyebilmesine olanak tanır. GPT-4o; içerik üretimi, analiz, kodlama desteği ve sohbet uygulamaları dahil olmak üzere genel amaçlı metin üretim görevleri için tasarlanmıştır. Daha hızlı yanıt süreleri ve daha yüksek verimlilik sunarken; muhakeme görevlerinde, çok dilli yeteneklerde ve görsel anlamada önceki GPT-4 varyantlarına kıyasla gelişmiş bir performans sergiler. OpenAI'nin model yelpazesinde GPT-4o, yeteneği erişilebilirlikle dengeleyen amiral gemisi bir sunum olarak konumlanır. Orijinal GPT-4 ve GPT-4 Turbo modellerine kıyasla daha verimli bir alternatif olarak yer alır; çoğu kıyaslamada karşılaştırılabilir veya daha üstün performans sağlarken istek başına daha az hesaplama kaynağına ihtiyaç duyar. Model, OpenAI'nin API'si aracılığıyla erişilebilir ve ChatGPT'nin standart hizmet katmanının temelini oluşturarak GPT-4 ailesinin en yaygın kullanılan modellerinden biri haline gelir.

OpenAI'nin kapsamlı eğitim verisi bu modelin geniş alan bilgisini destekliyor.

Tokonomix benchmark özeti
Bölüm 01

Hız analizi

Tüm benchmark çalıştırmalarında ölçülen gecikme. P50 (medyan) ve P95 (95. yüzdelik) normal ve yoğun yük altında yanıt hızının gerçekçi bir resmini verir.

P50 gecikme (medyan)P95 gecikme97 runs
30950869863146401941705-2206-15ms
Bölüm 02

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

100
Kod üretimi
99
Çok dilli
100
Akıl yürütme
Bölüm 03

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — gpt-4o
$2.50 1M giriş token başına
$10.00 1M çıkış token başına
≈ $0.0035 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$2.50
1M çıkış token başına$10.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.50

input / 1M

— stable

$10.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Bölüm 04

Saniye başına token

Ölçülen P50 gecikmesinden türetilen saniye başına token verimi. Yüksek daha iyidir; dalgalanmalar sağlayıcı tarafındaki yükü yansıtır.

Verim (token / s)400 / avg 391
640113

P50 gecikme × 200 çıkış token tahmininden hesaplandı — mutlak rakam bu varsayıma bağlıdır; önemli olan eğilimdir.

Bölüm 05

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

128K token uzun bağlamGenel amaçlı performansMetin üretimi ve özetlemeÇok turlu sohbet desteğiTalimat takibinde yüksek başarıDoğal dil anlama kapasitesi

Zayıf yönler

İnternet erişimi bulunmuyorGörsel işleme desteği yokBilgi kesim tarihi sonrası veri yok
Bölüm 06

Yetenekler

toolssource: litellmvisionjson modepdf inputjson schemaparallel toolsprompt cachingmax output tokens: 16384
Bölüm 07

Sık sorulan sorular

Metin üretimi, içerik oluşturma, soru-cevap ve özetleme görevlerini destekleyen geniş bir uygulama yelpazesi sunuyor.

OpenAI güvenlik katmanları ve içerik filtreleri modeli kurumsal ortamlara uygun kılıyor.

Tokonomix benchmark özeti
Bölüm 08

Kullanılabilirlik

Kullanılabilirlik

Bu modelin çağrıldığında ne sıklıkla yanıt verdiği — son 30 gün içindeki gerçek API istekleri ve canlı testler üzerinden ölçülmüştür. Bu kaliteden bağımsızdır: bu sayılar yalnızca modelin yanıt verip vermediğini gösterir, yanıtın ne kadar iyi olduğunu değil.

Son 7 gün

100.0%

n=28

Son 30 gün

100.0%

n=28

Medyan yanıt süresi

2,854ms

n=28

Baz alınan 96 ölçüm son 30 gün içinde.

Teknik detaylar

Yalnızca gerçek API çağrıları ve canlı test istekleri sayılır — dahili yoklamalar ve kıyaslama çalıştırmaları hariçtir.

Özel API anahtarıyla (BYOK) yapılan çağrılar hariçtir: bu hatalar anahtara özgüdür, model kesintisinin işareti değildir.

Başarısız çağrılar kalite puanlarına DAHİL EDİLMEZ — kalite yalnızca başarılı yanıtlar üzerinden ölçülür. Kullanılabilirlik ve kalite bağımsız sinyallerdir.

Kaydedilmiş süreye sahip başarılı çağrılarda medyan yanıt süresi (p50). Aykırı değerler medyanı ortalamadan daha az etkiler.

Toplam çağrı (30d)

28

OK yanıtlar (30d)

28

Toplam çağrı (7d)

28

OK yanıtlar (7d)

28

Görüntü kalite kontrolü pilotu (2026-06-10)

Geri çağırma

66.9%

n=300

Yanlış alarm

15.7%

n=300

Bölüm 09

Tokonomix kıyaslama kararları

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-595/100 · 75 runs
69 correct6 partial0 wrong92% accuracy
🏟️
Arena etkinliği
Günlük model arenası — karşılıklı değerlendirilir
Bu ay
Yarışmacı olarak
1Oynanan oyunlar
0 / 1Kazanılan / kaybedilen
3Beğeniler ▲
Jüri olarak
5Jüri olduğu turlar
Yakalanan kör noktalar
Tüm zamanlar
Yarışmacı olarak
1Oynanan oyunlar
0 / 1Kazanılan / kaybedilen
3Beğeniler ▲
Jüri olarak
5Jüri olduğu turlar
Yakalanan kör noktalar

Kör nokta tespiti, jüriler yaklaşan arena turlarında atlanan noktaları işaretledikçe etkinleşir.

Aylık geçmiş (1)
AyOynanan oyunlarKazanılan / kaybedilenBeğeniler ▲Jüri olduğu turlar
2026-0610 / 135
2026-06-14

Capability expansion: tools, vision, multimodal and structured outputs added

GPT-4o has undergone significant capability expansion in this benchmark window. The model now supports tool calling, vision processing, PDF input handling, and structured output modes including JSON mode, JSON schema validation, and parallel tool execution. Prompt caching has also been introduced for improved efficiency. These additions transform GPT-4o from a text-only model into a comprehensive multimodal system capable of handling diverse input types and output formats. The tool calling capabilities enable function execution and structured workflows, while vision support allows image analysis alongside text processing. PDF input support expands document handling capabilities. The addition of JSON schema validation and parallel tool execution provides developers with more precise control over model outputs and improved efficiency for complex workflows. Prompt caching can reduce latency and costs for repeated operations. These changes position GPT-4o as a versatile foundation model suitable for production applications requiring multimodal understanding, structured outputs, and programmatic integration. Users should note that while capabilities have expanded considerably, benchmark performance metrics for these new features will require evaluation in subsequent windows to assess quality and reliability.

Quality

Latency p50

Test runs

0

Tool calling enabled Vision and PDF support added Structured output modes available Prompt caching introduced
Bölüm 10

Tam model profili

gpt-4o — illustration 1
GPT-4o: Çoklu modaliteyi varsayılan haline getiren model

GPT-4o, OpenAI'nin metin, görüntü ve sesi ayrı modelleri ortak bir API arkasında birbirine eklemek yerine aynı ileri geçişte tek bir modelle işleyen ilk denemesiydi. 128k token bağlam penceresiyle metin ve görüntü girdisini kabul eder ve özel ses yüzeyleri aracılığıyla sesli giriş ve çıkışı da işler. Avrupa ekiplerinin 2024 ve 2025'te sunduğu GPT-4 ailesi ürün yüzeyinin çoğu bu modelde çalışıyordu ve çoğu zaman kimse soyağacının farkına bile varmadı.

OpenAI'nin yığınındaki en yeni model değil ve artık yeni yapılar için önerilen varsayılan değil, ancak bugün üretimde en çok dağıtılan modellerden biri olmaya devam ediyor.

4o'nun değiştirdiği şeyler

Önceki nesil — GPT-4 ve GPT-4 Turbo — üzerine görüntü ve araç kullanımı aşılanmış güçlü metin modelleriydi. 4o farklı inşa edildi. Eğitim pipeline'ı en başından itibaren çoklu modal yeteneği hedefledi ve bu durum en net şekilde iki yerde kendini gösteriyor.

Birincisi, ses girdisi ve çıkışı. 4o, realtime API aracılığıyla sesli konuşmaları "Whisper ile transkribe et, GPT-4 ile üret, bir TTS modeliyle sentezle" eski yaklaşımından maddi olarak daha düşük gecikmeyle destekliyor. Sıra alma, modeller zincirinin hiçbir zaman tam olarak başaramadığı bir doğallıkta hissettiriyor.

İkincisi, görüntü anlama. 4o gösterge paneli ekran görüntülerini okur, render edilmiş PDF sayfalarından tabloları çıkarır, diyagramları tanımlar ve grafikleri daha önceki GPT-4 görüntü yüzeyinden daha güvenilir şekilde işler. Model, küçük eksen etiketlerine sahip yoğun grafiklerde kusursuz değil ve herhangi bir döngüde insan incelemesine ihtiyaç duyacak kadar sık el yazısını yanlış okuyor, ancak genel amaçlı görüntü girdisi için alanın geri kalanının yetişmesi gereken standardı belirledi.

Hız üçüncü değişiklikti. 4o, karşılaştırılabilir kalitede GPT-4 Turbo'dan belirgin şekilde daha düşük gecikmeyle sunuluyor. Etkileşimli kullanım durumları için fark anında hissedildi ve bugün hâlâ hissediliyor.

Şu anda nerede duruyor

OpenAI'nin mevcut ürün yelpazesi GPT-4.1 ve GPT-5 ailesini çoğu kıyaslamada 4o'nun üzerine konumlandırıyor. Dürüst çerçeveleme, 4o'nun yığının ortasında oturduğudur: en zor akıl yürütmede yeni sınır modellerinin açıkça gerisinde, GPT-3.5 neslinin rahatça önünde, birçok günlük iş yükünde GPT-4.1 mini ile karşılaştırılabilir.

128k bağlam penceresi onu en görünür şekilde eskiten kısımdır. Sınır katmanında milyon token'lık bağlamların standart hale geldiği bir yılın ardından, 128k ciddi belge işleme veya tam kod tabanı komutlarını içeren herhangi bir iş yükü için kısa hissettiriyor. Sohbet biçimli trafik için hâlâ yeterli.

4o-mini varyantı maliyet duyarlı çalışmalar için popüler olmaya devam ediyor, ancak yeni yapılar için 4.1 mini nesli daha iyi bir seçimdir. Ses yüzeyi, 4o'nun hâlâ rutin olarak tercih edildiği tek yerdir — gpt-4o-audio ve realtime API, yeni modellerin tam olarak çoğaltamadığı bir dağıtım hikayesine sahiptir.

Kategoriler arası sürekli karşılaştırma /benchmarks/leaderboard adresinde bulunur. Hız ve zeka dökümü /benchmarks/speed ve /benchmarks/intelligence adreslerinde yer alır.

Bugün nerede yetersiz kalıyor

Uzun bağlam çalışması. 128k artık sınırda rekabetçi değil. Belge ağırlıklı iş yükleri için GPT-4.1'e veya GPT-5'e geçin.

Sınır akıl yürütmesi. En zor planlama, matematik ve kod sentezi komutları GPT-5 veya Claude Opus 4.7'ye gider. 4o bunları işler ancak görünür şekilde çekinir ve daha az cilalı çıktı üretir.

Yerel görüntü üretimi. 4o metin ve görüntü girdisidir, metinden görüntüye değil. Üretim rotaları için özel görüntü modellerinden birini kullanın.

Avrupa veri yerleşimi. Doğrudan OpenAI API'si bölge sabitleme olmadan Azure altyapısında çalışır. Azure OpenAI Hizmeti ayrı bir sözleşme altında bölgesel dağıtımlar sunar. Sert AB yerleşim gereksinimleri altındaki ekipler için OVH barındırmalı bir Mistral veya Llama 3 örneği farklı bir konuşmadır; bkz. /usecases/local.

Dağıtım notları

API, artık tanıdık Chat Completions ve Responses yüzeyidir. Akış, araç çağrıları, JSON modu, yapılandırılmış çıktılar — hepsi beklendiği gibi çalışır. Ses için realtime API, istek-yanıt uç noktalarından farklı davranan ve kendi yük testi yaklaşımına ihtiyaç duyan bir WebSocket yüzeyi üzerinden çalışır.

Prompt önbellekleme desteklenir ve kararlı sistem komutlarınız veya getirme destekli önekleriniz varsa kuruluma değer. Maliyet faydası, yeniden kullanılan bağlama sahip herhangi bir dağıtımda hemen görünür.

Günlükler, kötüye kullanım izleme için varsayılan olarak otuz gün boyunca saklanır. API girdileri, siz kabul etmedikçe eğitim için kullanılmaz. Kurumsal sözleşmeler kapsamında sıfır saklama mevcuttur.

4o üzerine inşa etmiş ve bir yükseltme değerlendiren ekipler için pratik geçiş hedefi iş yükü şekline bağlıdır. Uzun bağlamlı metin ağırlıklı çalışma GPT-4.1'e gider. Akıl yürütme ağırlıklı çalışma GPT-5'e gider. Ses ağırlıklı çalışma, OpenAI dağıtım hikayesiyle eşleşen bir halef sunana kadar 4o realtime yüzeyinde kalır. Ayrıntılı ses yönlendirmesi için bkz. /usecases/voice.

Onu seçmek

Aşağıdakilere ihtiyacınız olduğunda bugün GPT-4o'ya ulaşın:

  • İyi anlaşılmış ve iyi belgelenmiş bir dağıtım hikayesine sahip çoklu modal girdi.
  • Karşılaştırılabilir kalitede GPT-4 Turbo'dan daha düşük gecikme.
  • Realtime API aracılığıyla ses girdisi veya çıkışı.
  • Sınır yeteneğine ihtiyaç duymayan mevcut bir OpenAI tabanlı pipeline'da pragmatik bir orta katman seçeneği.

Metin ağırlıklı uzun bağlam çalışmasını hedefleyen yeni yapılar için atlayın — GPT-4.1 daha iyi bir varsayılandır. GPT-5 veya Claude Opus 4.7'nin açıkça önde olduğu sınır akıl yürütmesi için atlayın.

/live-test adresinde yeni seçeneklerle yan yana deneyin. Birçok üretim trafiği için kalite deltası, sürüm numaralarının ima ettiğinden daha küçüktür ve 4o'nun daha düşük fiyat noktası seçimi neyin ucu olduğudur.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

gpt-4o — illustration 2gpt-4o — illustration 3
Son otomatik test
15 Haz 2026 · 08:00 UTC · Hız testi
P50 gecikme
500 ms
P95 gecikme
667 ms
Hatalar
0 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·10 Haziran 2026