İçeriğe geç
Çalıştığı yer:USYapıldığı yer:United States
OpenAI

gpt-4o-mini-search-preview-2025-03-11

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··

gpt-4o-mini-search-preview-2025-03-11, OpenAI'ın GPT-4o mini modelinin bir varyantıdır ve şirketin dil modeli ürün gamında maliyet etkin bir seçeneği temsil eder. GPT-4o ailesinin bir parçası olarak, OpenAI'ın çoklu-modal mimarisi üzerine inşa edilirken düşük gecikme süresi ve azaltılmış hesaplama yükünün öncelik olduğu senaryolar için optimize edilmiştir. Bu önizleme sürümü arama işlevselliği içerir; bu da modelin eğitim tarihi kesintisinin ötesinde güncel veya olgusal verilerle yanıtları zenginleştirmek üzere harici bilgi erişim yetenekleriyle entegrasyon sağladığını gösterir. Model, sohbet robotları, içerik üretimi, özetleme ve genel amaçlı soru yanıtlama gibi uygulamaları destekleyerek standart metin üretimi görevleri için tasarlanmıştır. Arama önizleme tanımlaması, bu varyantın test veya erken erişim aşamasında olduğunu belirtir ve geliştiricilerin arama-destekli üretim kalıplarını denemesine olanak tanır. Tam bağlam penceresi boyutu kamuya açık olarak belirtilmemiş olsa da, GPT-4o mini ailesindeki modeller genellikle GPT-4 serisindeki daha büyük modellere kıyasla daha hızlı yanıt süreleri korurken çoğu yaygın kullanım senaryosu için yeterli bağlam kapasitesi sunar. OpenAI'ın model hiyerarşisi içinde gpt-4o-mini-search-preview-2025-03-11, yetenek ve ölçek açısından tam GPT-4o ve GPT-4 modellerinin altında yer alır, ancak hız ve verimlilik konusunda avantajlar sunar. Özellikle arama entegrasyonu yoluyla gerçek zamanlı bilgi erişiminin anlamlı değer sağladığı uygulamalarda, amiral gemisi modellerin en gelişmiş mantık yürütme yeteneklerine ihtiyaç duymadan güvenilir dil anlama ve üretimine ihtiyaç duyan kullanıcılara hizmet eder.

OpenAI'nin kapsamlı eğitim verisi bu modelin geniş alan bilgisini destekliyor.

Tokonomix benchmark özeti
Bölüm 01

Kalite puanları

Çeşitli görev kategorilerinde yargıç modelin puanlarından elde edilen değerlendirme sonuçları. Puanlar tutarlılık, doğruluk ve talimat takibini yansıtır.

100
Kod üretimi
90
Çok dilli
100
Akıl yürütme
Bölüm 02

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — gpt-4o-mini-search-preview-2025-03-11
$0.1500 1M giriş token başına
$0.6000 1M çıkış token başına
≈ $0.0002 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$0.1500
1M çıkış token başına$0.6000

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.1500

input / 1M

— stable

$0.6000

output / 1M

— stable

2026-05-242026-06-142026-06-14
Input
Output
Price change
⟳ synced weekly
Bölüm 03

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

Düşük gecikme, hızlı yanıtGerçek zamanlı web aramasıGüncel bilgiye erişimMetin üretimi ve özetlemeÇok turlu sohbet desteğiTalimat takibinde yüksek başarı

Zayıf yönler

Karmaşık akıl yürütmede sınırlıÖnizleme: özellikler değişebilirİnternet erişimi bulunmuyor
Bölüm 04

Yetenekler

toolssource: litellmvisionjson modepdf inputjson schemaparallel toolsprompt cachingmax output tokens: 16384
Bölüm 05

Sık sorulan sorular

Bilgi kesim tarihinden sonraki konular veya güncel veriler için web aramasını otomatik devreye alıyor.

OpenAI güvenlik katmanları ve içerik filtreleri modeli kurumsal ortamlara uygun kılıyor.

Tokonomix benchmark özeti
Bölüm 06

Kullanılabilirlik

Kullanılabilirlik

Henüz ölçüm verisi yok

Bu model için kullanılabilirlik istatistiklerini göstermek için yeterli API çağrısı henüz kaydedilmedi. Veri, model canlı trafik almaya başlayınca görünür.

Bölüm 07

Tokonomix kıyaslama kararları

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-592/100 · 75 runs
61 correct13 partial1 wrong81% accuracy
2026-06-14

Major capability expansion with tools and vision support added

This model version represents a significant evolution with the addition of multiple new capabilities including tools, vision, JSON mode, PDF input, JSON schema, parallel tools, and prompt caching. These additions transform the model from a text-only system into a multimodal platform with enhanced integration options. The expanded capability set enables developers to build more sophisticated applications with structured outputs, visual understanding, and efficient caching mechanisms. The introduction of tool calling and parallel tool execution particularly extends the model's utility for agentic workflows and complex task orchestration. Vision support adds multimodal understanding that was previously unavailable. JSON schema and JSON mode provide better control over structured outputs, while PDF input expands document processing capabilities. Prompt caching offers potential performance and cost optimizations for repeated queries. However, without performance metrics from the current benchmark window, it's unclear how these new features impact baseline text generation quality, latency, or accuracy. Users should evaluate whether the expanded capabilities meet their specific use cases while monitoring for any trade-offs in core text generation performance that may accompany this broader feature set.

Quality

Latency p50

Test runs

0

Tools and parallel execution added Vision capability now supported JSON schema and mode available Prompt caching enabled
Bölüm 08

Tam model profili

gpt-4o-mini-search-preview-2025-03-11 — illustration 1
gpt-4o-mini-search-preview-2025-03-11: Mart ayının mini-search sabitlemesi

gpt-4o-mini-search-preview-2025-03-11, OpenAI'nin küçük, arama destekli sohbet modelinin Mart 2025 tarihli anlık görüntüsüdür (snapshot). Yuvarlanan takma adla (rolling alias) aynı arama-aracı (retrieval-tool) mimarisini kullanır, ancak o yayın noktasında dondurulmuştur, böylece üretim dağıtımları bilinen davranışa karşı sabitleme yapabilir.

Arama temelli yanıtlar, model sürümü kayması (drift) karşısında alışılmadık derecede hassastır. Bir anlık görüntüyü sabitlemek; OpenAI önizleme hattını yinelemeye devam ederken atıf davranışını, sorgu stratejilerini ve sentez stilini öngörülebilir tutan şeydir.

Bu anlık görüntü neyi temsil ediyor

Mart 2025'e gelindiğinde, mini-search önizlemesi şunları gerçekleştirmişti:

  • Yuvarlanan takma adın hâlâ kullandığı atıf üst verisi (citation metadata) biçimini stabilize etmişti.
  • Arama çağrısı başına faturalandırma yapısını yerleşik hale getirmişti.
  • Orijinal önizleme sürümlerindeki daha yıkıcı sorgu oluşturma regresyonlarını çözmüştü.

Daha sonraki anlık görüntülere kıyasla içermediği şeyler:

  • 2025'in ortasında gelen ve yanıt başına arama çağrısı sayısını azaltan iyileştirilmiş sorgu yeniden yazımı (query-rewriting).
  • Otorite kaynakları daha agresif biçimde öne çıkaran atıf sıralama iyileştirmeleri.
  • 2025'in 2. çeyreği boyunca yapılan arka uç altyapı değişikliklerinden gelen gecikme (latency) iyileştirmeleri.

2025 ilkbaharında doğrulanan dağıtımlar için, doğrulamanın karşısında geçtiği anlık görüntü büyük olasılıkla budur.

Tarihli sabitleme arama modelleri için neden daha önemli

Arama destekli sohbetin, her biri üründe görünür hale gelen ve anlık görüntüler arasında değişebilen birden fazla davranışsal boyutu vardır:

  • Yanıt başına arama çağrısı sayısı — gecikme profilini ve istek başına maliyeti değiştirir.
  • Hangi kaynakların atıfta gösterileceği seçimi — yanıtın algılanan otoritesini etkiler.
  • Çıkarılan içerikle önceden eğitilmiş bilgiyi birleştirme sentez stili — yanıtın okunuşunu etkiler.
  • Modelin önceden eğitimden cevap vermek yerine ne zaman arama yapacağına karar verme eşiği — güncellik kapsamını etkiler.

Bir anlık görüntü sabitlemesi tüm bunları yerinde dondurur. Takma adla yuvarlanmak ise OpenAI'nin yeni bir revizyon yayınladığı gün bunların herhangi birinin kayabileceğini kabul etmek anlamına gelir.

Geçiş sorusu

Herhangi bir tarihli anlık görüntü sabitlemesiyle aynı biçimdedir.

  • Değerlendirme yaparken Mart sabitlemesini üretimde tutun.
  • Aday yeni anlık görüntüye karşı temsili bir sorgu setini yeniden çalıştırın.
  • Ham yanıt doğruluğunun yanı sıra atıf kalitesi, arama çağrısı verimliliği, gecikme ve sentez stili üzerinden karşılaştırın.
  • Daha yeni anlık görüntü, ürününüz için önemli olan boyutlarda kanıtlanabilir şekilde kazandığında geçiş yapın.

Stabil bir sabitlemeden çıkma gerekçesi nadiren "yenisi ortalama olarak daha iyi" şeklindedir. Asıl gerekçe, "yenisi, ürünümün etrafında inşa edildiği belirli şeylerde daha iyi"dir. Aslında hangi durumda olduğunuz konusunda kendinize karşı dürüst olun.

Yetersiz kaldığı alanlar

Çıkarılan içerik üzerinde ağır akıl yürütme. Mini, küçük modeldir. Sentez darboğaz haline geldiğinde doğru yükseltme tam search önizlemesidir.

Alana özel mahrem bilgi. Arama aracı kamuya açık web içeriğini indeksler. Dahili dokümanlar ayrı bir RAG hattı gerektirir.

Gecikmeye duyarlı etkileşimli kullanım. Arama, gidiş-dönüş ekler. Mini-search, tam search önizlemesinden daha hızlıdır ancak yine de tamamen üretilmiş yanıtlardan daha yavaştır.

Kendi kendine barındırma (self-hosted) dağıtımı. Arama aracı OpenAI'nin arka uç altyapısını gerektirir. /usecases/local incelemesi, şirket içi kısıtlar bağlayıcı olduğunda nelerin mevcut olduğunu kapsar.

Tam olarak bu anlık görüntüyü ne zaman sabitlemeli

Şu durumlarda gpt-4o-mini-search-preview-2025-03-11'i tercih edin:

  • Mart 2025 mini-search davranışı üzerinde bir arama temelli özellik yayınladıysanız ve bunu stabil tutmanız gerekiyorsa.
  • Atıf davranışı ve kaynak seçimi, 2025 ilkbahar değerlendirmenizden geçen şeyin parçasıysa.
  • Bir A/B testi veya araştırma protokolü, aylar boyunca sabit bir arama-modeli referansı gerektiriyorsa.

Şu durumlarda atlayın:

  • Sıfırdan başlıyorsanız — bunun yerine en yeni anlık görüntüyü sabitleyin.
  • Daha sonraki anlık görüntülerdeki sorgu yeniden yazımı veya gecikme iyileştirmeleri değerlendirmenizde kazandıysa.
  • Arama destekli hattın eventual stabil sürümü mevcutsa — yeni projeler için doğru hedef odur.

Dağıtım notları

Standart Chat Completions API. Arama aracı, istem temelinde model tarafından otomatik olarak çağrılır; API yüzeyi, yanıta yapılandırılmış atıf üst verisinin eklenmesi dışında, arama dışı modellerden değişmemiştir.

Token faturalandırması; girişteki metin, çıkıştaki metin ve arama çağrısı başına ücretler şeklinde ayrılır. Arama çağrısı başına ücret şu ana kadar mini-search anlık görüntüleri arasında değişmemiştir; ancak modelin aramaları tetikleme oranı anlık görüntüler arasında farklılaşabilir ve dolayısıyla görüşme başına etkin maliyet de değişebilir.

Atıf üst verisi biçimi bu anlık görüntü ve sonraki 2025 anlık görüntüleri boyunca stabildir; bu da UI render kodunun geçişler arasında yeniden kullanılabilir kalmasını sağlar.

Pragmatik okuma. Bu, mini-search'in Mart 2025 dondurulmasıdır. Ürününüz buna karşı doğrulandıysa sabitleyin. Kendi değerlendirmeniz, önemli olan boyutlarda daha yeni anlık görüntünün doğru hamle olduğunu söylediğinde geçiş yapın. Taahhüt etmeden önce /live-test üzerinde sorgu düzeyinde karşılaştırmalar çalıştırın.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

gpt-4o-mini-search-preview-2025-03-11 — illustration 2
Son otomatik test
14 Haz 2026 · 04:58 UTC · Test
P50 gecikme
4627 ms
P95 gecikme
Hatalar
0 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·26 Mayıs 2026