
gpt-4o-realtime-preview-2025-06-03, OpenAI'nin tam katmanlı akış (streaming) ses modelinin Haziran 2025 anlık görüntüsüdür (snapshot). Aralık 2024 dondurulmasının üzerinden altı ay geçtikten sonra, bu hat kesinti (interruption) yönetimi, gecikme süresi ve konuşma sırasındaki arka kanal (back-channel) algılaması konularında iyileştirmeler biriktirmiştir.
Bu, söz konusu iyileştirmelerin canlı ses ajanınıza somut biçimde fayda sağladığı ve aynı zamanda Aralık ile doğrulanmış dağıtımınızın etrafında ayarlanmış şeyleri bozmadığı durumlarda geçiş yapılması gereken anlık görüntüdür.
Aralık 2024'ten bu yana neler değişti
OpenAI, realtime hattı için ayrıntılı bir değişiklik günlüğü (changelog) yayımlamıyor; ancak davranışsal fark, her iki anlık görüntüyü aynı senaryolanmış canlı konuşma testleri üzerinden çalıştırarak gözlemlenebilir:
- Daha akıcı kesinti yönetimi. Aralık anlık görüntüsü, kullanıcı yanıtın ortasında araya girdiğinde zaman zaman kısa süreliğine "takılıyordu"; bu sürüm dinleme moduna daha temiz biçimde geçiş yapıyor.
- Kullanıcı konuşmasının bitişinden modelin yanıtının başlangıcına kadar olan uçtan uca gecikmede düşüş — bu durum model mimarisindeki değişikliklerden değil, arka uç (backend) altyapı değişikliklerinden kaynaklanıyor.
- Daha iyi arka kanal algılaması. Model, kısa onaylamaları ("evet", "hı-hı") yanıt gerektiren tam kullanıcı sıraları olarak yorumlama eğiliminde daha az.
- Garip konuşma anlarından — uzun sessizliklerden, hatalı biçimlendirilmiş kullanıcı girdilerinden, üst üste konuşma durumlarından — daha doğal toparlanma.
Belirgin biçimde değişmeyenler: WebSocket olay protokolü, hazır ses (voice) seçenekleri, temel API yüzeyi veya dakika başına faturalandırma yapısı.
Yükseltme ne zaman değerli
Canlı ses modelleri, değerlendirme metodolojisine alışılmadık ölçüde duyarlıdır. Toplu (aggregate) metrikler genellikle asıl önemli olan ayrıntıları kaçırır. Disiplinli bir geçişin biçimi:
- Siz değerlendirme yaparken Aralık sabitlemesini (pin) üretimde tutun.
- Temsili bir test korpusu oluşturun veya tazeleyin — kayıtlı referans aramaları, sentetik kesinti senaryoları, çok turlu akıl yürütme testleri ve ürününüz destekliyorsa çok dilli konuşmalar.
- Her iki anlık görüntüyü de test korpusunda çalıştırın.
- Kayıtları insanların dinlemesini ve konuşma kalitesini değerlendirmesini sağlayın. "Bu, yetkin bir ses ajanı gibi hissettiriyor" ifadesini yakalayan otomatik bir metrik yoktur.
- İnsan değerlendirmeli testler, özellikle ürününüz için önemli boyutlarda, tutarlı biçimde Haziran anlık görüntüsü lehine geldiğinde geçiş yapın.
Düzenlemeye tabi alanlardaki ses ajanları için, uyumluluk gereksinimlerine karşı yeniden doğrulamanın maliyetini de hesaba katın. Küçük bir kalite iyileştirmesi, doğrulama yükünü kaldıramayabilir.
Bu anlık görüntü bugün nerede konumlanıyor
2026 ortasında, çoğu ekibin OpenAI'nin premium akış ses hizmetine başka koşul belirtmeden başvurduğunda atıfta bulunduğu en güncel tarihli tam-realtime anlık görüntü budur. GPT-4o realtime hattı boyunca en geniş üretim geçmişine sahip anlık görüntüdür.
2026'da başlayacak yeni canlı ses projeleri için seçim, bu anlık görüntü ile OpenAI'nin daha sonra yayımladığı herhangi bir yeni sürüm ve realtime hattının nihai kararlı (stable) sürümü arasındadır. Burada sabitlemenin gerekçesi, herhangi bir tarihli anlık görüntüde olduğu gibi aynıdır — gelecekteki iyileştirmelere erişim yerine öngörülebilirlik.
Nerelerde yetersiz kalıyor
Tam-realtime hattının geri kalanıyla aynı kısıtlar.
Aslında akışa ihtiyaç duymayan iş yükleri. Audio-preview hattı entegre etmesi daha basit ve dakika başına daha ucuzdur.
Yüksek hacimde maliyet duyarlı dağıtımlar. Tam katman dakika başına ekonomisinin oturmadığı durumlar için mini-realtime mevcuttur.
Yalnızca transkripsiyon. Sesten metne çıktı tüm görev olduğunda, transcribe uç noktaları dakika başına daha ucuzdur.
Kendi kendine barındırma (self-hosted) dağıtım. OpenAI altyapısına WebSocket bağlantısı gereklidir. /usecases/local araştırması, kurum içi (on-prem) alternatifleri kapsamaktadır.
Tam olarak bu anlık görüntüyü ne zaman sabitlemeli
gpt-4o-realtime-preview-2025-06-03 modelini şu durumlarda seçin:
- Tam-realtime hattını 2025'in ortasından sonuna kadar değerlendirdiniz ve bu, kazanan anlık görüntü oldu.
- Aralık anlık görüntüsüne kıyasla kesinti yönetimi, gecikme veya arka kanal iyileştirmeleri ürününüz için önemli.
- Realtime hattının önizleme (preview) statüsünden çıkmasını beklerken kararlı bir davranışsal hedefe ihtiyacınız var.
Şu durumlarda atlayın:
- Daha yeni bir anlık görüntü mevcut ve değerlendirmenizi kazandı.
- Nihai kararlı realtime modeli önizleme dışına terfi ettirildi.
- Maliyet asıl operasyonel kısıtsa — mini-realtime kullanın.
- Akış aslında gerekli değilse — audio-preview hattını kullanın.
Karşılaştırmaya değer alternatifler
Halihazırda doğrulanmış dağıtımlarla tutarlılık önemliyse daha eski Aralık anlık görüntüsü. Maliyet, akıl yürütme kapasitesinden daha önemliyse mini-realtime. Akış bir gereklilik değilse audio-preview hattı. /usecases/voice üzerindeki ses modeli araştırması, rakip realtime sağlayıcılarını kapsamaktadır.
Dağıtım notları
Realtime hattının geri kalanıyla aynı WebSocket API yüzeyi. Anlık görüntü sabitlemesi tamamen bir model adı seçimidir; olay modeli ve mesaj biçimi anlık görüntüler arasında değişmez.
Gelen ses ve giden ses için dakika başına faturalandırma, ayrıca metin eşdeğeri için token başına faturalandırma. Akış ek yükü dakika başına ücrete dahildir. Kapasite planlaması, eşzamanlı çağrı (concurrent-call) biçimindedir.
İstemci tarafı entegrasyon kodu, protokol kararlı olduğu için anlık görüntü geçişleri arasında yeniden kullanılabilir. Anlık görüntüler arasındaki davranışsal değişiklikler, bu tarihli sabitlemenin dondurduğu şeylerdir.
Pragmatik değerlendirme. Bu, tam katman realtime'ın Haziran 2025 dondurulmasıdır. Değerlendirmeniz, Aralık anlık görüntüsüne kıyasla iyileştirmelerin kendi trafiğinizde gerçek olduğunu gösterdiğinde sabitleyin. Herhangi bir geçiş kararından önce /live-test adresinde canlı çağrı karşılaştırmaları çalıştırın.
Son teknik inceleme: 2026-05-22 — Tokonomix.ai

