Sesli asistan uygulamaları için uygun mu?

Evet, düşük gecikmeli akış mimarisi sesli uygulamalar için özellikle tasarlanmış.

Uzun belge analizinde kullanılabilir mi?

Uzun belgeler gerçek zamanlı modelin öncelikli alanı değil; büyük bağlam için standart API uygundur.

Önizleme sürümünde neler değişebilir?

Özellikler, gecikme garantileri ve fiyatlandırma önizleme aşamasında değişebilir.

Çalıştığı yer:USYapıldığı yer:United States

Arşivlendi

Bu model sağlayıcı tarafından kullanımdan kaldırıldı. Geçmiş veriler korunmaktadır.

31 Mayıs 2026 tarihinden beri kullanılamıyor.

OpenAI

gpt-realtime-mini-2025-12-15

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan·Yayınlandı 22 Mayıs 2026·Son inceleme 26 Mayıs 2026

GPT-Realtime-Mini-2025-12-15, OpenAI tarafından düşük gecikmeli, konuşma tabanlı uygulamalar için tasarlanmış özel bir dil modelidir. GPT-Realtime serisinin bir parçası olan bu model, maksimum yetenek yerine yanıt hızı ve verimliliği ön planda tutar; bu da onu etkileşimli sesli uygulamalar, sohbet botları ve gecikmeyi en aza indirmenin kritik olduğu diğer kullanım senaryoları için uygun kılar. Model, amiral gemisi modellere kıyasla daha düşük hesaplama yükü ile metin işler ve üretir, böylece gerçek zamanlı etkileşimlerde daha hızlı geri dönüş süreleri sağlar. "Mini" ibaresi, bu modelin OpenAI'ın model portföyündeki daha küçük ve verimli bir varyant olduğunu, daha iyi yanıt hızı karşılığında belirli bir derinlikte muhakeme ve bilgi genişliğinden ödün verdiğini gösterir. Konuşma, soru-cevap ve içerik üretimi gibi standart metin üretme yeteneklerini korurken, kullanıcılar karmaşık muhakeme görevlerinde, kapsamlı bilgi erişiminde veya ince ayrıntılı analizlerde OpenAI'ın daha büyük modellerine kıyasla daha sınırlı bir performans beklemelidir. Aralık 2025 sürüm tarihi, o döneme ait mimari iyileştirmeler ve güncel eğitim verileri içerdiğine işaret etmektedir. Bu model, OpenAI ekosisteminde özel bir nişi doldurur; ham yetenek açısından GPT-4 ve GPT-4 Turbo gibi tam ölçekli modellerin altında konumlanmakta, ancak etkileşim hızının maksimum zekadan daha önemli olduğu senaryolar için optimize edilmiştir. Bilinmeyen bağlam penceresi boyutu, ya teknik dokümantasyondaki eksiklikleri ya da dağıtım yapılandırmasına bağlı değişiklikleri yansıtıyor olabilir. Sesli asistanlar, müşteri hizmetleri otomasyonu veya gecikmeye duyarlı diğer uygulamalar geliştiren kuruluşlar, bu modelin birincil hedef kitlesini oluşturmaktadır.

OpenAI'nin kapsamlı eğitim verisi bu modelin geniş alan bilgisini destekliyor.
— Tokonomix benchmark özeti

Bölüm 01

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰

API tarifeleri — gpt-realtime-mini-2025-12-15

$0.6000 1M giriş token başına

$2.40 1M çıkış token başına

≈ $0.0008 tipik konuşma başına (800 token)

Giriş vs çıkış fiyatı (1M token başına)

1M giriş token başına$0.6000

1M çıkış token başına$2.40

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.6000

input / 1M

— no change

$2.40

output / 1M

— no change

2026-05-242026-05-242026-05-24

Input

Output

Price change

⟳ synced weekly

Bölüm 02

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

Düşük gecikme, hızlı yanıtSesli etkileşim desteğiMetin üretimi ve özetlemeÇok turlu sohbet desteğiTalimat takibinde yüksek başarıDoğal dil anlama kapasitesi

Zayıf yönler

Karmaşık akıl yürütmede sınırlıYalnızca ses ve metin odaklı kapsamUzun belge analizine uygun değil

Bölüm 03

Sık sorulan sorular

Gerçek zamanlı API çok düşük ilk token gecikmesiyle çalışır; kesin değerler ağ koşullarına göre değişir.

OpenAI güvenlik katmanları ve içerik filtreleri modeli kurumsal ortamlara uygun kılıyor.
— Tokonomix benchmark özeti

Bölüm 04

Kullanılabilirlik

Henüz ölçüm verisi yok

Bu model için kullanılabilirlik istatistiklerini göstermek için yeterli API çağrısı henüz kaydedilmedi. Veri, model canlı trafik almaya başlayınca görünür.

Bölüm 05

Tokonomix kıyaslama kararları

● 2026-05-24

gpt-realtime-mini, güçlü yaratıcı yazım puanlarıyla temel referansı belirliyor

OpenAI'nin gpt-realtime-mini-2025-12-15 modeli, temel yeteneklerde referans metrikleri belirleyen ilk performans penceresiyle değerlendirme sürecine giriyor. Model, yaratıcı yazım görevlerinde dikkat çekici bir başarı göstererek ortalama %82,5'e ulaşıyor; bu da anlatı ve hayal gücüne dayalı içerik üretiminde sağlam bir performansa işaret ediyor. Matematiksel akıl yürütme %68,8 ile orta düzey yetkinlik sergilerken, kodlama yeteneği de benzer şekilde %67,5'lik bir taban seviyesinde kalıyor. Talimat takibi yetenekleri %76,3 olarak ölçülüyor; bu, kullanıcı yönergelerine makul ölçüde uyum sağlandığını ancak iyileştirmeye açık alanlar bulunduğunu gösteriyor. Gerçek zamanlı kullanım için optimize edilmiş bir model varyantı olarak bu puanlar, kullanıcıların karşılaşacağı başlangıç performans profilini yansıtıyor. Yaratıcı yazımın teknik görevlere kıyasla öne çıkması, modelin özellikle sohbet uygulamaları, içerik üretimi ve anlatı kalitesinin önem taşıdığı etkileşimli senaryolar için uygun olabileceğine işaret ediyor. Matematik ve kodlama puanları, teknik alanlarda işlevsel ancak olağanüstü olmayan bir kapasiteye işaret ediyor. Geçmiş karşılaştırma verisi bulunmadığından bu metrikler, sonraki değerlendirme pencerelerinde gerçekleşecek iyileşme veya gerilemeleri izlemek için temel oluşturuyor.

Quality

—

Latency p50

—

Test runs

✓ Güçlü yaratıcı yazım temel seviyesi belirlendi✓ Talimat takibi %75'in üzerinde✗ Matematiksel akıl yürütme diğer yeteneklerin gerisinde✗ Kodlama performansı %67,5 ile orta düzeyde

Bölüm 06

Tam model profili

gpt-realtime-mini-2025-12-15: OpenAI'ın hafif ses katmanının Aralık güncellemesi

gpt-realtime-mini'nin Aralık 2025 anlık görüntüsü, Ekim sürümünden birkaç ay sonra geliyor ve ilgili gpt-audio-mini Aralık güncellemesinin sunduğu sessiz-artımlı değişim biçimini taşıyor. Aynı mimari, aynı API yüzeyi ve aynı geniş yetenek zarfı söz konusu. Değişen şey, altta yatan ağırlıklar ve ses botu operatörlerinin üretim ortamında gerçekten fark ettiği bir avuç davranışsal detay.

Aralık güncellemesinin sıkılaştırdığı noktalar

Gürültülü ortamlarda konuşma sırası alışverişi, Ekim davranışına göre iyileşti. Mini, özellikle ortam gürültüsünün yanlış konuşma sonu algılamasını tetiklediği durumlarda, kullanıcı tam olarak bitirmeden birkaç yüz milisaniye önce yanıt vermeye başlama eğilimi gösteriyordu. Aralık ağırlıkları bu durumu daha temiz ele alıyor ve devam eden konuşma enerjisi algılandığında ekstra bir vuruş bekliyor. Bu, Ekim anlık görüntüsüyle ilgili en yaygın ses botu operatörü şikayetiydi ve Aralık güncellemesi büyük ölçüde bunu ele alıyor.

Çokdilli sentez kalitesi Hollandaca, Lehçe ve Çekçe dillerinde ilerledi. Bunlar, önceki mini anlık görüntülerinde desteklenen Avrupa dilleri arasında en zayıf olanlardı ve Aralık ağırlıkları, Roman dil kümesiyle aradaki farkı anlamlı şekilde daralttı. Avrupa çokdilli dağıtımları için bu, en duyulabilir gelişme.

Araç çağrısı gecikmesi hafifçe sıkılaştırıldı. Bir fonksiyon çağrısı ile devam eden ses yanıtı arasındaki sessiz hava penceresi artık daha kısa ve çağrılar arasında daha tutarlı. Konuşmalar sırasında sık sık araçları çağıran ürünler için bu, daha doğal bir konuşma ritmine dönüşüyor.

Ses karakteri esasen değişmedi. Seçilmiş OpenAI sesleri Ekim anlık görüntüsündekiyle aynı şekilde duyuluyor; yalnızca uzun ifadelerde, çoğu kullanıcının normal kullanımda fark etmeyeceği çok küçük prozodi ayarlamaları var.

Yetenek zarfı

Bu anlık görüntü, standart gpt-realtime-mini biçimini miras alıyor: WebSocket tabanlı akış bağlantısı, akış içi fonksiyon çağrısı ve araç kullanımı, konuşma sırası alışverişi için ses etkinliği algılama, ses klonlama yok, büyük Avrupa ve Asya dilleri genelinde çokdilli kapsam.

Tam gpt-realtime modeline göre konumlandırma da değişmedi. Mini, konuşma deseninin sınırlı olduğu ve çağrı başı karmaşıklığın orta düzeyde olduğu, yüksek hacimli gecikmeye bağlı ses işlerini yönetiyor. Müşteri destek botları, IVR değiştirmeleri, rezervasyon akışları, yapılandırılmış niyet ağaçları. Gerçekten karmaşık çok turlu muhakeme veya yaklaşık on beş dakikayı geçen uzun konuşma tutarlılığı için, tam gpt-realtime veya gpt-realtime-1.5 daha iyi seçim olmaya devam ediyor.

Aralık'ı Ekim'e göre ne zaman seçmeli

Bugün yayına giren yeni üretim dağıtımları için, Aralık anlık görüntüsü doğru varsayılan sabitleme. Davranışsal farklar, yaygın iş yüklerinde gerileme yerine iyileştirmeler ve sıfırdan başlangıç için geçiş maliyeti sıfır.

gpt-realtime-mini-2025-10-06 üzerinde mevcut üretim için geçiş sorusu, iyileştirmelerin yeniden doğrulama çalışmasına değip değmediğidir. Dağıtımınız, Hollandaca veya Lehçe sentez kalitesinin önemli olduğu Avrupa çokdilli iş yüklerine hizmet ediyorsa veya operatörleriniz gürültülü ortamlarda botun kullanıcı cümlelerinin üzerine bastığına dair şikayetler alıyorsa, Aralık'a geçiş muhtemelen kendini amorti eder. Dağıtımınız Ekim davranışında stabilse ve iyileştirmeler gerçekte sahip olduğunuz acı noktalarını ele almıyorsa, geçişi ertelemek mantıklıdır.

Geçiş yolu düşük risklidir. API yüzeyi özdeş. İstem kütüphaneleri ve konuşma akışları temiz bir şekilde aktarılır. İş, delta'ların iş yükünüz için kabul edilebilir olduğunu doğrulamak için değerlendirme paketinizi yeniden çalıştırmaktan ibarettir.

Yetersiz kaldığı noktalar

Yüzen gpt-realtime-mini için geçerli olan aynı sınırlar burada da geçerli. Bir konuşma sırasında karmaşık çok adımlı muhakeme bir güçlü yan değil. On beş dakikayı geçen uzun konuşmalar bağlam kayması gösteriyor. Derin araç çağrısı dallanması doğruluk kaybediyor. Bu iş yükleri için, tam gpt-realtime doğru yükseltme.

Aralık anlık görüntüsü, temel yetenek zarfını değiştirmiyor. Aynı zarf içinde davranışı rafine ediyor. İş yükünüz mini'nin muhakeme tavanına dayanıyorsa, mini'nin hiçbir anlık görüntüsü bunu düzeltemez. Mimari cevap, tam modele veya ayrı bir uzun bağlam muhakeme bileşenine sahip yığılmış bir mimariye geçmektir.

Dikkate alınması gereken diğer unsurlar

Konuşma döngüsü olmadan saf sentez için, gpt-4o-mini-tts daha düşük maliyetle özel TTS katmanıdır. Canlı diyaloga ihtiyaç duymayan transkripsiyon ile özet iş akışları için, gpt-audio-mini ve gpt-audio-mini-2025-12-15 gibi tarihli anlık görüntüleri bu daha dar işi kapsar. Ses G/Ç ile eşleştirilmiş daha zengin muhakeme istediğiniz ses multimodal iş için, gpt-audio mini katmanının üzerinde yer alır.

Çapraz tedarikçi olarak, Google'ın gemini-2.5-flash-preview-tts gibi TTS uç noktaları sentezi kapsar ancak birleşik konuşma döngüsünü kapsamaz. OpenAI realtime mini ile doğrudan karşılaştırma yanıltıcıdır çünkü ürünler farklı mimari biçimlerdir.

AB veri yerleşimi, bu anlık görüntüde veya ilgili OpenAI realtime uç noktalarının hiçbirinde varsayılan olarak karşılanmaz. Veri işleme anlaşmalarına sahip bölgesel ağ geçitleri, düzenlenmiş Avrupa dağıtımları için pratik geçici çözüm olmaya devam ediyor.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Son otomatik test

31 May 2026 · 04:22 UTC · Test

P50 gecikme

—

P95 gecikme

—

Hatalar

1 / 6 çalıştırma

Son inceleyen Tokonomix Ekibi·26 Mayıs 2026