İçeriğe geç
Seviye C — Uzman
Çalıştığı yer:USYapıldığı yer:United States
OpenAI

gpt-4

Seviye C — Uzman

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··

GPT-4, OpenAI tarafından geliştirilen ve Mart 2023'te piyasaya sürülen büyük ölçekli çok modlu bir dil modelidir. OpenAI'nin GPT (Generative Pre-trained Transformer) serisinin dördüncü neslini temsil eder ve hem metin hem de görsel girdileri kabul ederken metin çıktıları üretir. Model, transformer mimarisi üzerine inşa edilmiştir ve çeşitli internet metinleri ile diğer veri kaynaklarıyla eğitilmiştir, ancak OpenAI eğitim veri seti büyüklüğü, mimari parametreleri veya tam eğitim metodolojisi hakkında spesifik detayları açıklamamıştır. Model, metin üretimi, soru yanıtlama, özetleme, çeviri ve karmaşık muhakeme dahil olmak üzere geniş bir doğal dil işleme görevleri yelpazesi için tasarlanmıştır. GPT-4, öncülü GPT-3.5'e kıyasla gerçeksel doğruluk, muhakeme yetenekleri ve karmaşık talimatları takip etme gibi alanlarda gelişmiş performans sergiler. Nüanslı komutları işleme ve daha uzun konuşmalar boyunca tutarlı bağlam sürdürme konusunda artırılmış yetenek gösterir. Model ayrıca standart testler ve kodlama zorlukları dahil olmak üzere profesyonel ve akademik kıyaslamalarda daha iyi performans sergiler. OpenAI'nin model yelpazesi içinde GPT-4, en yetenekli ürün olarak en üst katmanda yer alır ve GPT-3.5 ile daha önceki GPT-3 varyantlarının ardılıdır. OpenAI'nin API'si aracılığıyla erişilebilir ve ChatGPT Plus abonelik hizmetini destekler. Modelin sürüme göre değişen bir bağlam penceresi vardır ve standart uygulamalar birkaç bin token'ı işler. OpenAI, ilk lansmanın ardından farklı yeteneklere ve bağlam uzunluklarına sahip GPT-4'ün birden fazla varyantını piyasaya sürmüştür.

OpenAI'nin kapsamlı eğitim verisi bu modelin geniş alan bilgisini destekliyor.

Tokonomix benchmark özeti
Bölüm 01

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

100
Kod üretimi
95
Çok dilli
100
Akıl yürütme
Bölüm 02

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — gpt-4
$30.00 1M giriş token başına
$60.00 1M çıkış token başına
≈ $0.0300 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$30.00
1M çıkış token başına$60.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$30.00

input / 1M

— stable

$60.00

output / 1M

— stable

2026-05-242026-06-142026-06-14
Input
Output
Price change
⟳ synced weekly
Bölüm 03

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

Metin üretimi ve özetlemeÇok turlu sohbet desteğiTalimat takibinde yüksek başarıDoğal dil anlama kapasitesiVeri analizi ve raporlamaİçerik oluşturma ve düzenleme

Zayıf yönler

İnternet erişimi bulunmuyorGörsel işleme desteği yokBilgi kesim tarihi sonrası veri yok
Bölüm 04

Yetenekler

toolssource: litellmprompt cachingmax output tokens: 4096
Bölüm 05

Sık sorulan sorular

Metin üretimi, içerik oluşturma, soru-cevap ve özetleme görevlerini destekleyen geniş bir uygulama yelpazesi sunuyor.

OpenAI güvenlik katmanları ve içerik filtreleri modeli kurumsal ortamlara uygun kılıyor.

Tokonomix benchmark özeti
Bölüm 06

Kullanılabilirlik

Kullanılabilirlik

Henüz ölçüm verisi yok

Bu model için kullanılabilirlik istatistiklerini göstermek için yeterli API çağrısı henüz kaydedilmedi. Veri, model canlı trafik almaya başlayınca görünür.

Bölüm 07

Tokonomix kıyaslama kararları

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-589/100 · 75 runs
59 correct13 partial3 wrong79% accuracy
2026-06-14

GPT-4 adds tools and caching while maintaining stable core performance

GPT-4 introduces two significant new capabilities in this benchmark window: tools support and prompt caching. These additions expand the model's practical utility for developers building integrated applications and managing token costs for repeated contexts. Core performance metrics remain largely stable across the board. The model continues to deliver consistent results in reasoning, coding, and general language tasks without significant regression or improvement in baseline capabilities. Response times and output quality show minimal variance from the previous window, suggesting a focus on feature expansion rather than fundamental model refinement. The new tools capability enables function calling and structured interactions, while prompt caching offers efficiency gains for applications with repeated prompts. Users can expect the same reliable performance they've come to associate with GPT-4, now with enhanced integration options. For production deployments, these new features provide meaningful workflow improvements without introducing instability to existing use cases. The model's established strengths in nuanced reasoning and code generation persist unchanged.

Quality

Latency p50

Test runs

0

Tools support added Prompt caching capability introduced Stable core performance maintained
Bölüm 08

Tam model profili

gpt-4 — illustration 1
GPT-4: çıtayı belirleyen model

GPT-4, OpenAI'nin GPT-4 ailesinden çıkan ilk öncü sürümdür — Mart 2023'te yayımlandığında, kendisinden sonra gelen her büyük dil modelinin karşılaştırıldığı referans noktası hâline gelen modeldir. Mimari ayrıntıları o dönemde paylaşılmamıştı ve bugün hâlâ paylaşılmıyor. Buna karşılık yetenek seti, maliyet profili ve dağıtım hikâyesi, yıllara yayılan üretim kullanımı sayesinde ayrıntılı biçimde belgelenmiş durumda.

Yeni projeler için artık önerilen varsayılan değil. Ama emekliye de ayrılmış değil. Doğru çerçeveleme bu ikisinin arasındaki orta noktadır.

Bu model neden önemliydi

GPT-4'ün gelişi, ekiplerin üretime alınabilir bir dil modelinden bekledikleri standardı sıfırladı. Üç spesifik değişim söz konusuydu.

Akıl yürütme. GPT-4, 3.5 jenerasyonunun yapamadığı bir şekilde çok adımlı çıkarımları zincirleyebiliyordu. Hukuki sözleşme analizi, çok belgeli sentez, muğlak spesifikasyonlardan yola çıkarak özgün kod üretimi — bunların hepsi "ilginç bir demo ama çıktısı kırılgan" konumundan "uygun inceleme katmanlarıyla üretime alınabilir" konumuna geçti. 3.5'tan kalitatif uçurum, test etmeye başladığınız ilk saat içinde değerlendirme sonuçlarında hissedilen türdendi.

Çok dillilik. Çok dilli kapsamada bir basamak sıçraması yaşandı. Avrupa idari yazışmaları, tıbbi terminoloji, birden fazla yargı bölgesindeki hukuk dili — hepsi önceki jenerasyona göre belirgin biçimde daha iyi işleniyordu. Özellikle Avrupalı kurumsal ekipler için bu, sınır ötesi ürün özelliklerinin dağıtılabilir hâle gelmesini sağlayan kilit açılımdı.

Araç kullanımı. Fonksiyon çağırma (function calling), üretim ekiplerinin üzerine gerçek anlamda ajan döngüleri inşa edebileceği bir olgunluğa erişti. Şema disiplini, sonraki jenerasyonların sunacağı kadar sıkı değildi; ama ilk dalga ajan çerçevelerinin etrafına sarılabileceği kadar sıkıydı.

2024 ve 2025 boyunca gelenler — GPT-4 Turbo, GPT-4o, GPT-4.1, GPT-5 — GPT-4'ün ilk olarak ortaya koyduğu yeteneklerin rafine edilmiş ve genişletilmiş hâllerinden ibarettir.

Güncel modellere karşı eksik kaldığı yönler

8.192 token'lık bağlam penceresi, en görünür sınırlamadır. Öncü kademede milyon token'lık bağlamların standart hâline geldiği bir yılın ardından, 8k sohbet trafiği için yeterli ama belge ağırlıklı herhangi bir iş yükü için yetersizdir. Bu modelde belge işleme genellikle, güncel modellerin gereksiz kıldığı parçalama (chunking) stratejilerini gerektiriyordu.

Görsel giriş yok. Görme yeteneğine sahip varyantlar sonradan geldi. Temel GPT-4 modeli yalnızca metin tabanlıdır.

Ses arayüzü yok. Aynı hikâye. Ses yetenekleri 4o jenerasyonuyla birlikte geldi.

Akıl yürütme derinliği. Güncel öncü modellerin — GPT-5, Claude Opus 4.7, derin araştırma varyantları — zarafetle ele aldığı en zorlu planlama ve sentez istemleri, GPT-4'ün konfor alanının görünür biçimde dışındadır. Model bu istemleri işliyor ama çıktı kalitesi belirgin biçimde düşüyor.

Hız. Son iki yıldaki çıkarım yığını iyileştirmeleri, yeni modellerin gecikme profilini orijinal GPT-4'ün bulunduğu noktanın çok altına çekti. Etkileşimli kullanım senaryolarında bu fark hemen hissediliyor.

Ekipler neden hâlâ bu modeli çalıştırıyor

Tarihsel ataletin dışında iki neden var.

Birincisi, tam olarak bu tanımlayıcıyı onaylamış uyum rejimleri. GPT-4, 2023 ve 2024 boyunca en çok denetim döngüsünden geçen modeldir; çünkü o dönem için mevcut öncü seçenekti. Bazı düzenlemeye tabi iş akışları hâlâ GPT-4 üzerinde çalışıyor; çünkü daha yeni bir modelde yeniden denetim maliyeti yüksek ve iş yükü henüz daha yenisine ihtiyaç duymuyor.

İkincisi, alt akış (downstream) hatları için değerlendirme kararlılığı. Ayrıştırıcılarını, sınıflandırıcılarını veya test takımlarını GPT-4'ün spesifik çıktı tarzına sıkı sıkıya bağlı şekilde inşa eden ekipler, alt akış araçlarını kendi temposunda göç ettirirken kararlılık için bu modele sabitleniyor.

Her iki nedenin de bir raf ömrü var. Yeni denetim döngüleri varsayılan olarak güncel modelleri seçiyor; yeni hatlar GPT-4 üzerine inşa edilmiyor.

Göç yolları

Doğru göç hedefi, iş yükünün biçimine bağlıdır.

GPT-4'ün öncü seçim olduğu ve güncel öncü kapasitenin önemli olduğu iş yükleri için GPT-4.1 veya GPT-5 doğal yükseltmedir. Her ikisi de çok daha uzun bağlam, belirgin biçimde daha güçlü akıl yürütme ve daha sıkı yapılandırılmış çıktı davranışı sunar. Maliyet daha yüksek değil, daha düşüktür.

O dönemde daha ucuz hiçbir şey yeterince iyi olmadığı için GPT-4 üzerinde çalışan iş yükleri için gpt-4.1-mini çoğu zaman doğru hedeftir. Çoğu üretim isteminde kalite karşılaştırılabilir; maliyet ve gecikme profili belirgin biçimde daha iyidir.

4o jenerasyonundan önceye dayanan ve görsel veya ses eksikliğini şu anda harici servislerle çözen çok modlu iş yükleri için doğal adım, yerel çok modlu desteğe sahip GPT-4o veya GPT-4.1'e konsolidasyondur. Tek başına mimari sadeleşme bile genellikle göç maliyetini karşılar.

Dağıtım notları

API yüzeyi Chat Completions'tır; OpenAI'nin sonraki her modelinin kullandığı aynı biçim. Akış (streaming), fonksiyon çağırma, şemanın makul olduğu durumlarda yapılandırılmış JSON modu çıktısı — hepsi kabaca yeni modellerdeki gibi davranır.

İstem önbellekleme (prompt caching), GPT-4'te yeni modellerdeki kadar gelişmiş değildir. Kararlı uzun bağlam ön ekleriyle GPT-4.1'de kendini ödeyen yeniden kullanım verimliliği kazanımları, burada daha küçüktür.

Bölgesel veri ikamesi konusu, OpenAI'nin alışıldık hikâyesidir: doğrudan API, bölge sabitlemesi olmadan Azure altyapısında çalışır; Azure OpenAI Service, ayrı bir sözleşme kapsamında bölgesel dağıtımlar sunar. Katı AB veri ikamesi gereksinimleri olan ekipler için OVH üzerinde barındırılan bir Mistral veya Llama 3 örneği farklı bir konuşmadır; bkz. /usecases/local.

Seçim kriterleri

Bugün GPT-4'ü şu durumlarda kullanın:

  • Bir uyum rejimi tam olarak bu tanımlayıcıyı onayladıysa ve yeniden denetim döngüsü devam ediyorsa.
  • Bir alt akış hattı, modelin çıktı tarzına o kadar sıkı şekilde uyarlanmışsa ki göç maliyeti yükseltme kazancından ağır basıyor ve ekibin bu durumu düzeltmek için bir planı var.
  • Tarihsel karşılaştırma çalışmaları, orijinal GPT-4 referans noktasını gerektiriyorsa.

Yeni projeler için, iş yükünün biçimine bağlı olarak GPT-4.1, GPT-4.1 mini veya GPT-5 ailesi modellerinden birini hedefleyin. 4 jenerasyonu çıtayı belirledi. Artık çıta o değil.

Kategoriler arası karşılaştırma için bkz. /benchmarks/leaderboard. Daha geniş OpenAI ürün hattı yönü için bkz. GPT-4.1.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

gpt-4 — illustration 2gpt-4 — illustration 3
Son otomatik test
14 Haz 2026 · 04:56 UTC · Test
P50 gecikme
7408 ms
P95 gecikme
Hatalar
0 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·26 Mayıs 2026