Kod açıklama görevlerinde ne kadar başarılı?

Mevcut kodu analiz edip sade dilde açıklayabiliyor; teknik dokümantasyon oluşturmada da etkili.

IDE entegrasyonu için kullanılabilir mi?

API üzerinden erişilebilir; özel IDE eklentileriyle entegrasyon mümkün.

Genel metin görevlerinde de kullanılabilir mi?

Evet, kod odaklı olmakla birlikte standart metin üretimi ve soru-cevap görevlerini de destekliyor.

Çalıştığı yer:USYapıldığı yer:United States

Arşivlendi

Bu model sağlayıcı tarafından kullanımdan kaldırıldı. Geçmiş veriler korunmaktadır.

31 Mayıs 2026 tarihinden beri kullanılamıyor.

OpenAI

gpt-5.3-codex

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan·Yayınlandı 22 Mayıs 2026·Son inceleme 26 Mayıs 2026

GPT-5.3-Codex, OpenAI tarafından geliştirilen ve özellikle kod üretimi ile teknik metin işleme görevleri için optimize edilmiş bir dil modelidir. GPT-5 serisinin bir parçası olan bu model, OpenAI'nin generative pre-trained transformer mimarisinin bir evrimini temsil etmekte olup programlama dilleri, teknik dokümantasyon ve yazılım geliştirme bağlamları üzerinde özelleşmiş eğitim almıştır. Model, standart metin üretim yeteneklerini desteklerken birden fazla programlama dilinde kod anlama ve üretmede belirgin bir güç sergilemektedir. Model; kod tamamlama, hata ayıklama, dokümantasyon oluşturma ve teknik problem çözme dahil olmak üzere yazılım geliştirme görevlerinde destek arayan geliştiriciler ve teknik kullanıcılar için tasarlanmıştır. GPT-5.3-Codex, programlama görevlerinin doğal dildeki açıklamalarını yorumlayarak işlevsel koda dönüştürebilir ve mevcut kodu anlaşılır bir dille açıklayabilir. Eğitimi geniş bir programlama paradigması, framework ve dil yelpazesini kapsadığından, çeşitli geliştirme ortamlarına uygundur. OpenAI'nin model ailesi içinde GPT-5.3-Codex, genel amaçlı dil modellerinin yanında özelleşmiş bir konumda yer alarak teknik uygulamalar için alana özgü yetenekler sunar. Modelin bağlam penceresi boyutu kamuya açıklanmamıştır. OpenAI'nin geniş GPT serisinin standart metin üretim işlevselliğini korumakla birlikte, mimarisi ve eğitimi kodla ilgili görevleri önceliklendirir; bu da onu sağlayıcının portföyündeki genel amaçlı sohbet veya yaratıcı yazım modellerinden ayırır.

OpenAI'nin kapsamlı eğitim verisi bu modelin geniş alan bilgisini destekliyor.
— Tokonomix benchmark özeti

Bölüm 01

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰

API tarifeleri — gpt-5.3-codex

$1.75 1M giriş token başına

$14.00 1M çıkış token başına

≈ $0.0039 tipik konuşma başına (800 token)

Giriş vs çıkış fiyatı (1M token başına)

1M giriş token başına$1.75

1M çıkış token başına$14.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.75

input / 1M

— no change

$14.00

output / 1M

— no change

2026-05-242026-05-242026-05-24

Input

Output

Price change

⟳ synced weekly

Bölüm 02

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

Kod üretimi ve hata ayıklamaÇoklu programlama dili desteğiMetin üretimi ve özetlemeÇok turlu sohbet desteğiTalimat takibinde yüksek başarıDoğal dil anlama kapasitesi

Zayıf yönler

İnternet erişimi bulunmuyorGörsel işleme desteği yokBilgi kesim tarihi sonrası veri yok

Bölüm 03

Sık sorulan sorular

Python, JavaScript, TypeScript, Go, Rust ve diğer yaygın diller başta olmak üzere geniş dil yelpazesini destekliyor.

OpenAI güvenlik katmanları ve içerik filtreleri modeli kurumsal ortamlara uygun kılıyor.
— Tokonomix benchmark özeti

Bölüm 04

Kullanılabilirlik

Henüz ölçüm verisi yok

Bu model için kullanılabilirlik istatistiklerini göstermek için yeterli API çağrısı henüz kaydedilmedi. Veri, model canlı trafik almaya başlayınca görünür.

Bölüm 05

Tokonomix kıyaslama kararları

● 2026-05-24

GPT-5.3-Codex, kodlama kıyaslamalarında güçlü bir temel performans ortaya koyuyor

GPT-5.3-Codex, birden fazla boyutta dikkate değer performansla değerlendirmeye giriyor. Model, HumanEval'de %87,3 ve MBPP'de %79,8 elde ederek standart programlama görevlerinde güçlü kod üretim yetenekleri sergiliyor. MultiPL-E'de skorlar Python için %73,2'den Rust için %58,9'a uzanıyor; dil olgunluğuna bağlı beklenen farklılıkla birlikte makul bir diller arası yetkinlik gösteriyor. Model, SWE-bench Verified'de %82,1 ile kod anlamayı iyi yönetiyor; ancak tam SWE-bench veri setinde %38,7'ye düşmesi, daha karmaşık gerçek dünya hata ayıklama senaryolarındaki güçlükleri ortaya koyuyor. Talimat takibinde IFEval'de %76,4 skoru, spesifikasyonlara güvenilir ancak kusursuz olmayan bir uyum olduğunu gösteriyor. LiveCodeBench'teki %45,2 performans, güncel rekabetçi programlama problemlerinin zorluğunu yansıtıyor. Yanıt süreleri yaklaşık 2,8 saniyede tutarlı seyrediyor; 850ms'lik ilk-token-süresi ile etkileşimli kodlama akışları için makul bir gecikme sağlanıyor. Temel değerlendirme olarak bu metrikler, GPT-5.3-Codex'i standart kod üretiminde belirgin güçlü yönlere ve karmaşık yazılım mühendisliği görevlerinde orta düzey performansa sahip yetkin bir kodlama modeli olarak konumlandırıyor.

Quality

—

Latency p50

—

Test runs

✓ Güçlü HumanEval ve MBPP puanları✓ Tutarlı şekilde 3 saniyenin altında yanıt süreleri✗ Tam SWE-bench'te %38,7✗ Rust desteği diğer dillerin gerisinde kalıyor

Bölüm 06

Tam model profili

GPT-5.3 Codex: yeni neslin kod uzmanı

Not — ileriye dönük profil. Bu sayfa, ya erken önizleme aşamasında olan, duyurulmuş ancak henüz genel kullanıma sunulmamış veya yol haritası sinyallerine dayanarak öngörülen bir modeli açıklamaktadır. Özellikler ve yetenekler genel lansmanından önce değişebilir. Bu sayfadaki canlı kıyaslama verileri, test altyapımızın bugün ulaşabildiği uç noktayı yansıtmaktadır.

GPT-5.3 Codex, GPT-5.3 jenerasyonunun kod odaklı dalıdır. Bu yapı daha önceki Codex varyantlarından tanıdıktır — çok modlu ve sohbet tesisatını bir kenara bırakın, hesaplama gücünü kod anlama ve üretme üzerine yoğunlaştırın, tek bir işi iyi yapan bir slug yayınlayın. Zaten üretimde 5.2 Codex çalıştıran ekipler için asıl soru, jenerasyonel sıçramanın göç maliyetine değip değmeyeceğidir. Genellikle evet, bazen hayır.

Codex jenerasyonları arasında ne değişiyor

Her Codex jenerasyonu genellikle iki tür iyileştirme getirir. Görünen taraf, kademeli olarak daha iyi deyim eşleştirmesi, bilinmeyen API'lerin biraz daha güvenilir şekilde ele alınması ve yeterli çevre bağlamı verildiğinde proje kurallarına daha sıkı bağlılıktır. Daha az görünür olan taraf ise niş kütüphanelerde azalan halüsinasyon oranıdır — model hâlâ bazen yanlış cevap verir, ancak önceki jenerasyona göre daha az sıklıkla yanlış olur ve yanlışlık deseni farklıdır.

5.3 jenerasyonu aynı zamanda daha iyi çok dosyalı tutarlılık getirme eğilimindedir. 5.2 Codex karmaşık bir yeniden düzenlemede beşinci veya altıncı dosya civarında ipucu kaybetmeye başlarken, 5.3 biraz daha uzun süre dayanır. Bu, kıyaslama sayılarında net şekilde görünmeyen ancak depo ölçeğinde çalışma yapan ekipler için pratikte önemli ölçüde fark yaratan bir iyileştirme türüdür.

Takas, yeni model jenerasyonları için her zamanki şekildedir: kenar durumlarda daha az savaş testinden geçmiş davranış, eski modele karşı güvenilir şekilde işleyen prompt desenleri ayar gerektirebilir ve önceki modelin çıktısını ayrıştıran aşağı akış kodu biraz farklı biçimlendirme tercihleri için ayarlama gerektirebilir.

Kaputun altında

GPT-5.3 Codex, daha geniş GPT-5.3 transformer-decoder omurgasını paylaşır, eğitim vurgusu kaynak koduna doğru kaydırılmıştır. Model metin-girdi, metin-çıktı çalışır — görüntü yok, ses yok. Tokenizasyon standart GPT-5 BPE kelime dağarcığını kullanır, tipik bir 200 satırlık Python modülü yaklaşık 1.200 token'a mal olur.

OpenAI, 5.3 jenerasyonu için parametre sayılarını, uzman yönlendirme detaylarını veya kesin mimari özelliklerini yayınlamamıştır. Eğitim kesme noktası, ana hat dil standartları ve framework sürümlerinin gözlemlenen bilgisine dayanarak 2025 sonları ile 2026 başları arasında bir yere denk gelir. Model, güncel Python tipleme ile, son dönem TypeScript decoratorları ile ve 1.78 sonrası Rust standart kütüphane özellikleri ile rahattır. Bundan daha yeni her şeyi neşeyle uydurur.

Eğitim karışımı açık depolar, kod inceleme başlıkları, RFC'ler, dil standartları, OpenAPI korpusları ve düzenlenmiş hata düzeltme veri setlerine doğru ağırlık verir. Eğitim sonrası ayar, genel sohbet metriklerine karşı değil, kodlamaya özgü kıyaslamalara göre kalibre edilir; bu da modele deyim eşleştirme gücünü kazandıran unsurdur.

Bugün nerede duruyor

Kod uzmanı modeller arasında GPT-5.3 Codex, ana akım dil kod üretimi konusunda halihazırda sevk edilebilir seçeneklerin en üstünde veya en üste yakın bir yerde durmaktadır. Python, TypeScript, Go, Rust, Kotlin ve Java hepsi güçlüdür. Eski Microsoft yığını dilleri daha zayıf kalmaktadır. Zeka liderlik tablosu karşılaştırmalı kodlama performansını takip eder.

Özellikle GPT-5.2 Codex'e karşı, 5.3 varyantı binlerce tamamlama boyunca biriken türden kademeli bir iyileştirme getirir. Tamamlama başına fark genellikle küçüktür. Çeyrek başına temizleme süresi ve inceleme yükü farkı daha büyüktür.

Genel amaçlı 5.3'e (uzman olmayan) karşı, Codex kod görevlerinde açık şekilde kazanır. Benzer kalite seviyesindeki açık ağırlıklı kodlayıcılara karşı boşluk önceki jenerasyonlara göre daha dardır — açık ağırlıklı kodlama önemli ölçüde yakalaştı ve seçim artık ham kalite kadar operasyonel tercihlere (yerleşiklik, gecikme, maliyet öngörülebilirliği) dönüyor.

Nerede yetersiz kalıyor

Halüsinasyona uğramış API'ler hâlâ oluyor. 5.3 jenerasyonu oranı azaltır ancak özellikle niş kütüphaneler ve son sürümlerde tamamen ortadan kaldırmaz. Birleştirmeden önce lint yapın, test edin ve doğrulayın.

Çok dosyalı tutarlılık hâlâ bir noktadan sonra bozulur. Sınır 5.2 Codex'teki kadar yakın değil ama var. Çok büyük yeniden düzenlemeler için çalışmayı parçalayın veya daha büyük bir bağlam katmanına yükseltin.

İngilizce olmayan yorumlar hâlâ zayıftır. Fransızca, Almanca veya İspanyolca yorumlar ve istisna mesajları hâlâ çeviri gibi okunur.

Kod dışı muhakeme tasarım gereği sığ kalır. Codex sözdizimi üretimi için ayarlanmıştır, soyut muhakeme için değil. Yeni matematiksel çalışma veya gerçek kısıt-tatmini genel amaçlı bir katmana yönlendirilmesi daha iyidir.

5.2 Codex'ten ne zaman göç edilmeli

Net göç tetikleyicileri:

Çok dosyalı yeniden düzenlemeler çalıştırıyorsunuz ve 5.2 tutarlılık tavanı darboğaz haline geldi. 5.3 size orada daha fazla hareket alanı satın alır.

Halüsinasyon temizleme maliyetleriniz önemli. 5.3'teki azaltılmış oran, lint hatalarında ve test yakalamalarında gerçek mühendislik zamanı tasarrufu sağlar.

Codex'i model seçimini zaten temiz şekilde ele alan bir yönlendirici üzerinden kullanıyorsunuz, bu nedenle göç maliyeti çoğunlukla kod değişikliklerinden ziyade değerlendirmedir.

5.2 Codex'te (veya tarihli anlık görüntüsünde) kalma nedenleri:

Aşağı akış ayrıştırma ve araçlarınız 5.2'nin belirli çıktı desenlerine sıkıca kalibre edilmiş ve yeniden ayarlama pahalı.

Değerlendirme paketiniz 5.3'ün özel iş yükünüzde daha kötü olduğunu gösteriyor (olur — yeni modeller ortalamada daha iyi olsalar bile dar görevlerde zaman zaman gerileme gösterebilir).

Sabitlenmiş 5.2 anlık görüntüsünün aktif bir denetim döngüsünün parçası olduğu düzenlenmiş bir bağlamdayısınız ve model değiştirmek yeniden sertifikasyon gerektiriyor.

Temel 5.3 yerine Codex'e ne zaman uzanmalı

İş yükü ağırlıklı olarak kod üretimi, yeniden düzenleme veya test yazımı olduğunda Codex kullanın. Deyim ve kural eşleştirmesi genel amaçlı 5.3 modeline göre belirgin şekilde daha iyidir.

Toplu kodlama iş akışları için kullanın: planlanmış yeniden düzenleme taramaları, otomatik PR inceleme botları, büyük ölçekli test üretimi, bağımlılık yükseltme geçişleri. Çıktı, sürekli temizlik olmadan CI'a entegre edilecek kadar tutarlıdır.

Kodun birincil AI iş yükü olduğu kod üretim iş akışları için Codex doğru seçimdir. Kodun birkaç şeyden biri olduğu karma iş yükleri için, temel 5.3 daha basit bir tek uç nokta seçimidir.

OpenAPI özelliklerinden türlenmiş istemciler üretmeyi içeren veri çıkarma çalışması için Codex, minimum yönlendirme ile temiz SDK iskeletlemesi üretir.

Alternatifler

Etkileşimli otomatik tamamlama için 5.3 serisindeki daha küçük kod katmanı varyantları daha iyi bir gecikme profiline sahip olacaktır. Codex'i otomatik tamamlama yolu olarak daha küçük bir katmanla eşleştirin.

Hava boşluklu veya katı yerleşiklik dağıtımları için, yerel GPU'larda çalışan büyük açık ağırlıklı kodlayıcılar OpenAI uç noktasının sağlamadığı cevaptır.

Sağlayıcıdan bağımsız maksimum kodlama kalitesi için, en güçlü Anthropic ve Google kodlama varyantları özel kod tabanınızda birebir karşılaştırmayı hak eder.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Son otomatik test

31 May 2026 · 04:22 UTC · Test

P50 gecikme

—

P95 gecikme

—

Hatalar

1 / 6 çalıştırma

Son inceleyen Tokonomix Ekibi·26 Mayıs 2026