
gpt-image-2, OpenAI'in özel görsel yığınının ikinci nesil yenilemesidir ve düzenleme tarafının "yararlı" olmaktan çıkıp gerçekten güçlü hâle geldiği sürümdür. gpt-image-1 üretim ve düzenlemeyi tek bir uç noktada birleştirirken, gpt-image-2 düzenleme geçişini her yeni üretimde zar atmak yerine yinelemeli iyileştirme etrafında üretim iş akışları kurabileceğiniz kadar iyi hâle getiriyor.
Neyi getiriyor
Kompozisyon sadakati öne çıkan iyileştirme. Birden fazla öznenin tanımlı uzamsal ilişkilerle yer aldığı sahneler, özneler arası tutarlı ışıklandırma ve fiziksel olarak akla yatkın etkileşimler, OpenAI'in önceki herhangi bir görsel sürümünden daha güvenilir biçimde sonuç veriyor. Modeli üç kişiyi bir masa etrafına ve aralarına belirli bir nesneyi yerleştirecek şekilde brieflediğinizde, yaklaşık bir tahmin almak yerine tam olarak istediğinizi geri alma şansınız artık makul düzeyde.
Görseller içindeki metin oluşturma, OpenAI soyunda ilk kez gerçekten iyi. Çok satırlı metin, karışık yazı tipi boyutları ve karmaşık kompozisyonlar içindeki metin artık üretim işi için kullanılabilir. Bu en çok pazarlama yaratıcı çalışmalarında önemli; çünkü üzerine yerleştirilmiş metni olan bir banner reklamında gpt-image-1.5 ile gpt-image-2 arasındaki fark, çıktıyı yayına almak ile tasarımcıya geri göndermek arasındaki farktır.
Birleşik uç nokta deseni devam ediyor. Üretim, düzenleme, inpainting ve varyasyonlar için hâlâ tek bir API çağrısı yapıyorsunuz. Düzenleme davranışı bu sürümde daha sıkı. Düzenlemeler maskelenmiş bölgeye yerel kalıyor ve çevredeki görüntünün yapısını sızdırmıyor — bu önceki sürümlerde tekrarlayan bir başarısızlık moduydu.
Mimari notları
OpenAI mimari ayrıntıları yayınlamadı. Gözlemlenebilir davranıştan yola çıkarak, model uzun veya kompozisyonel olarak karmaşık komutlarda bozulmadan gpt-image-1'den çok daha yüksek prompt yoğunluğunu kaldırabiliyor. Çıktı çözünürlüğü aynı 2048×2048 yerel tavanda ve aynı en-boy oranı ön ayarlarıyla sınırlı kalıyor; ancak API üzerinden yapılan upscaling yolu, önceki nesle göre daha temiz büyük format çıktıları üretiyor.
El ve parmak anatomisi belirgin biçimde gelişti. Başarısızlık oranları, çoğu iş akışında artık özel bir anatomi kontrolü geçişine ihtiyaç duymayacağınız kadar düşük. Premium çıktı için hâlâ bir insan gözden geçirici istersiniz, ancak o gözden geçirme için ayrılan bütçe daha küçük.
İlişkili görüntü serisi boyunca stil tutarlılığı, gpt-image-1'e kıyasla gerçekten daha iyi. Bir tema üzerine on varyasyon ürettiğinizde, gpt-image-2 estetiği set boyunca daha güvenilir biçimde koruyor. Bu, hikâye anlatımı çalışmaları, çizgi roman tarzı diziler ve birden fazla kare arasında görsel sürekliliğin briefin bir parçası olduğu her türlü çıktı için önem taşıyor.
Nerede yetersiz kalıyor
Bir seri boyunca belirli kimliğe sahip insanları korumak hâlâ bir sınır. Model, jenerik fotogerçekçi insanlarda ve tutarlı stilize karakterlerde iyi; ancak belirli, isimlendirilmiş bir karakterin yüz görüntüde aynı şekilde görünmesi gerekiyorsa, referans görüntüsüyle koşullanabilen kontrol edilebilir bir difüzyon yığını hâlâ kazanıyor. Bu, bir kalite açığından çok modelin tasarlanma biçiminin yarattığı bir kategori sınırı.
Sıkı boyutsal doğruluk gerektiren endüstriyel diyagramlar bir güçlü yan değil. Model teknik diyağrama benzeyen bir şey üretiyor, ancak mühendislik düzeyinde hassasiyet için güvenilemez. CAD'e bitişik işler CAD yazılımında yapılır, üretken bir modelde değil.
Görüntüler içindeki çok küçük metin — çıktı çözünürlüğünde karakter başına yaklaşık yirmi pikselin altında — hâlâ tutarsız. Yoğun spesifikasyon metni veya ince yazı için, modelin işlemesine güvenmek yerine uygulama kodunuzda gerçek metni üst katmana yerleştirmek hâlâ daha doğru.
Modeli seçmek
OpenAI kataloğunun en iyisini isteyip premium katman maliyetini karşılayabildiğiniz yeni görsel üretim çalışmaları için gpt-image-2 varsayılan seçimdir. Tarihli anlık görüntü gpt-image-2-2026-04-21, düzenlenmiş iş akışlarında veya tekrarlanabilirliğin önemli olduğu her yerde sabitlenecek sürümdür.
Görüntü başına maliyetin baskın olduğu yüksek hacimli çalışmalar için gpt-image-1-mini bütçe katmanıdır; gpt-image-1.5 ise orta katman seçeneğidir. Bunlarla gpt-image-2 arasındaki seçim çoğunlukla bir kalite kararı değil, ekonomik bir karardır; çünkü üçü de çoğu iş akışı için kullanılabilir çıktı üretir.
Sektörler arası karşılaştırmada, nano-banana-pro-preview premium katmanda en yakın rakip. Bazı stilize estetiklerde kazanıyor, görüntü içi metin oluşturmada kaybediyor. Karar vermeden önce kendi gerçek prompt dağılımınızda benchmark yapın; çünkü gpt-image-2 ile Nano Banana Pro arasındaki göreceli sıralama, en sık ne tür iş ürettiğinize göre değişiyor.
AB veri ikametgâhı hâlâ varsayılan olarak karşılanmıyor. Bölgesel ağ geçidi deseni, düzenlenmiş Avrupa dağıtımları için geçici çözümdür ve OpenAI'in yakın vadede AB'de barındırılan görsel uç noktaları sunacağına dair henüz bir sinyal yok.
Son teknik inceleme: 2026-05-22 — Tokonomix.ai
