İçeriğe geç
Çalıştığı yer:USYapıldığı yer:United States
OpenAI

gpt-3.5-turbo-instruct

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··

GPT-3.5-turbo-instruct, OpenAI tarafından geliştirilen ve GPT-3.5 mimarisine dayanan bir metin üretim modelidir. Sohbet formatı yerine verilen bir istemden metni devam ettiren bir tamamlama modeli olarak çalışır. Bu model, talimatları daha iyi takip etmek ve kullanıcı amacıyla uyumlu çıktılar üretmek için insan geri bildiriminden pekiştirmeli öğrenme (RLHF) içeren InstructGPT eğitim metodolojisini kullanır. Kullanıcıların bir istem sağladığı ve üretilmiş bir metin yanıtı aldığı tek turlu tamamlama görevleri için tasarlanmıştır. Model, yaratıcı yazım, özetleme, metin dönüştürme, kod üretimi ve tamamlama tarzı bir arayüzden yararlanan diğer görevler dahil olmak üzere geleneksel metin üretim kullanım senaryoları için optimize edilmiştir. Sohbet için optimize edilmiş modellerden farklı olarak, gpt-3.5-turbo-instruct birden fazla değişimde sohbet bağlamını korumaz ve bunun yerine bireysel istemlere yüksek kaliteli yanıtlar üretmeye odaklanır. Temel GPT-3 modellerine kıyasla gelişmiş talimat takip yetenekleri de dahil olmak üzere GPT-3.5 serisinin altında yatan mimari iyileştirmelerini paylaşır. OpenAI'nin model yelpazesinde, gpt-3.5-turbo-instruct, GPT-3.5 ailesindeki birincil tamamlama modeli olarak özel bir konuma sahiptir. OpenAI'nin son dönemdeki geliştirmelerinin çoğu gpt-3.5-turbo ve GPT-4 gibi sohbet için optimize edilmiş modellere odaklanmış olsa da, bu model özellikle tamamlama tarzı etkileşimler gerektiren kullanıcılara hizmet eder. Tamamlama arayüzünü korurken, instruct-tuning metodolojisiyle gelişmiş performans sunarak text-davinci-003 gibi önceki GPT-3 tamamlama modellerinin yerini etkili bir şekilde almıştır.

GPT-3.5-turbo-instruct, OpenAI'nin sohbet formatı yerine klasik tamamlama arayüzünü tercih eden geliştiriciler için özel olarak koruduğu tek GPT-3.5 modelidir.

Tokonomix model karşılaştırma raporu
Bölüm 01

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰
API tarifeleri — gpt-3.5-turbo-instruct
$1.50 1M giriş token başına
$2.00 1M çıkış token başına
≈ $0.0013 tipik konuşma başına (800 token)
Giriş vs çıkış fiyatı (1M token başına)
1M giriş token başına$1.50
1M çıkış token başına$2.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.50

input / 1M

— no change

$2.00

output / 1M

— no change

2026-05-242026-05-242026-05-24
Input
Output
Price change
⟳ synced weekly
Bölüm 02

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

Klasik tamamlama arayüzüRLHF ile güçlendirilmiş talimat takibiYaratıcı yazım görevlerinde başarılıKod üretimi ve tamamlama desteğiMetin dönüştürme işlemlerinde etkiliÖzetleme görevlerinde yetkinTek adımlı sorgular için optimizeGPT-3.5 mimarisi iyileştirmeleri

Zayıf yönler

Çok turlu sohbet desteği yokKonuşma bağlamını korumuyorYeni modellere göre eski mimariMultimodal yetenekler bulunmuyor
Bölüm 03

Sık sorulan sorular

gpt-3.5-turbo sohbet formatında mesaj dizileri alırken, gpt-3.5-turbo-instruct klasik tamamlama formatında tek bir prompt alır ve devamını getirir. Sohbet uygulamaları için gpt-3.5-turbo, tek adımlı metin üretimi için bu model tercih edilir.

Tek seferlik metin üretimi ve kod tamamlama görevleri için hâlâ güvenilir bir seçenek olsa da, çoğu kullanım senaryosunda sohbet modellerine yönelme eğilimi devam ediyor.

Tokonomix editör değerlendirmesi
Bölüm 04

Kullanılabilirlik

Kullanılabilirlik

Henüz ölçüm verisi yok

Bu model için kullanılabilirlik istatistiklerini göstermek için yeterli API çağrısı henüz kaydedilmedi. Veri, model canlı trafik almaya başlayınca görünür.

Bölüm 05

Tokonomix kıyaslama kararları

2026-05-24

GPT-3.5-turbo-instruct tamamlama modeli için temel referans oluşturuldu

Bu ilk kıyaslama, OpenAI'nin GPT-3.5'in tamamlama odaklı varyantı olan GPT-3.5-turbo-instruct için temel performans profilini ortaya koyuyor. İlk değerlendirme olarak, tüm metrikler ileride yapılacak karşılaştırmalar için başlangıç referans noktasını temsil ediyor. Model, sohbet tabanlı GPT-3.5-turbo'ya alternatif olarak tek seferlik talimat takibi ve metin üretimi görevleri için tasarlanmış, tamamlama odaklı konumlanışını ortaya koyuyor. Kullanıcılar, bu varyantın chat API formatı yerine completion API formatını kullandığını ve bu sayede metin ekleme, yaratıcı yazım ve yapılandırılmış çıktı üretimi gibi belirli kullanım senaryolarına uygun olduğunu göz önünde bulundurmalı. Temel veriler, modelin standart kıyaslama boyutlarındaki mevcut yeteneklerini yansıtıyor. İleriki değerlendirmeler, yanıt kalitesi, tutarlılık ve davranıştaki iyileşme veya gerilemeleri belirleyerek performansın zaman içinde nasıl evrildiğini izleyecek. Bu ilk değerlendirme olduğundan, henüz herhangi bir performans eğilimi ya da kararlılık örüntüsü tespit edilemiyor. Modelin farklı yönlendirme stratejileri ve görev türleri altındaki davranışı, ek kıyaslama pencereleri biriktikçe netleşecek ve gelişim seyri ile güvenilirlik özelliklerine ilişkin anlamlı bir uzunlamasına analiz yapılmasına olanak sağlayacak.

Quality

Latency p50

Test runs

0

İlk temel referans oluşturuldu
Bölüm 06

Tam model profili

gpt-3.5-turbo-instruct — illustration 1

⚠️ Kullanımdan kaldırılmış model. OpenAI bu modeli emekliye ayırdı. Yeni projeler için, uygun maliyetli genel kullanım için GPT-4o mini veya daha güçlü mantık yürütme için GPT-4.1 modellerine bakın. Mevcut entegrasyonlar, API uç noktası kapanmadan önce geçiş planlaması yapmalıdır.

gpt-3.5-turbo-instruct: tamamlama tarzı 3.5

gpt-3.5-turbo-instruct, GPT-3.5 Turbo varyantıdır ve modeli Chat Completions arayüzü yerine eski Completions API aracılığıyla sunmuştur. Tek metin girişi, metin çıkışı, messages dizisi yok, roller yok, prompt'un etrafına sarılmış sohbet biçimlendirmesi yok — sadece prompt'un kendisi ve modelin onunla devam ettirdiği şey.

Artık kullanımdan kaldırılmıştır. Uç nokta hala yanıt veriyor ancak Completions API yüzeyinin kendisi OpenAI ürün yelpazesinde giderek azalıyor ve bu model anlamlı son direniş noktalarından biri.

Neden ayrı bir varyant var oldu

OpenAI Mart 2023'te GPT-3.5 Turbo'yu piyasaya sürdüğünde, Chat Completions API yeni kalıptı. messages dizisi, sistem rolü, rol tabanlı prompt'lama — bunların hepsi yeni altyapıydı. Dışarıdaki birçok kod, GPT-3 tarafından kullanılan eski Completions API'sine karşı yazılmıştı; burada bir dize gönderirdiniz ve model onu devam ettirirdi.

Bu kodu sohbet arayüzüne geçirmek önemsiz değildi. Prompt'ların yeniden yapılandırılması, rol sınırlarının tanımlanması ve sohbet biçimlendirmesinin model davranışını değiştirdiği sınır durumların hata ayıklanması gerekiyordu. Eski API yüzeyi üzerine inşa edilmiş üretim hattına sahip ekipler için, OpenAI bir köprü olarak gpt-3.5-turbo-instruct'ı gönderdi — normal 3.5 Turbo ile aynı model ağırlıkları, eski API şekli aracılığıyla sunulmuş.

Varyant, özellikle üç iş yükü şekli için faydalıydı. Modelin konuşma yanıtı etrafına sarmaması gereken, tek bir token veya kısa etiket istediğiniz sınıflandırma ve etiketleme hatları. Prompt'un zaten kısmi bir çıktı olduğu ve devamını istediğiniz, sohbet dönüşü değil, kod tamamlama tarzı iş akışları. Completions API'sinin token olasılıklarını sohbet yüzeyinden daha doğrudan sunduğu logprobs'a bağımlı hatlar.

Üçü için de, sohbet arayüzü ek yük ekliyordu — biçimlendirme için ekstra tokenlar, sohbet tarzı yanıtlar üzerinde eğitilmiş olmasıyla şekillenen model davranışı, biraz farklı çıktı stili. Instruct varyantı, bu iş yüklerinin eski yöntemle çalışmaya devam etmesine izin verdi.

Model nasıl davrandı

Ailenin geri kalanıyla aynı 3.5 nesil davranışı. 3.5 seviyesinde mantık yürütme derinliği. Olgusal yollarda geri getirme artırımına veya insan incelemesine ihtiyaç duyan gerçeklik. Bazen aşırı hevesli, bazen de fazla uyumlu olan ret kalibrasyonu.

Sohbet modeli gibi davranmadığı şey buydu. Instruct varyantı, yanıtları konuşma çerçevesine sarmadı, "bir AI asistanı olarak" klişelerini üretmedi, sohbet-eğitimli yöntemlerle çekinmedi. Temiz devam istleyen iş yükleri için, altta yatan yetenek aynı olsa bile normal 3.5 Turbo'dan daha iyi bir uyumdu.

16.385 tokenlik bağlam penceresi, daha geniş 3.5 ailesinden miras alındı.

Neden ekipler instruct'a sabitlendi

Yukarıdaki eski kod nedeninin yanı sıra iki neden.

Birincisi, logprobs erişimi. Completions API, token düzeyinde logprobs'u sohbet arayüzünden daha doğrudan sundu. Kısıtlanmış kod çözme, yapılandırılmış çıktı örnekleme, güven puanlarıyla sınıflandırma veya herhangi bir logprobs-farkında alt akış işi yapan ekipler, bu yüzey için instruct varyantına sabitlendiler. Sohbet arayüzü sonunda benzer yetenekler kazandı, ancak instruct API uzun süre bu tür işler için daha temiz bir şekildi.

İkincisi, daha az biçimlendirme tokeni. Sohbet arayüzü her isteğe birkaç token biçimlendirme ekler, bu da yüksek hacimde birikir. Çok kısa prompt'lar ve çok kısa tamamlamalar olan iş yükleri için, instruct varyantının tokenizasyon ek yükü daha düşüktü, bu da çağrı başına biraz daha ucuz maliyetlere ve biraz daha düşük gecikmeye dönüştü.

Sohbet arayüzü olgunlaştıkça her iki neden de zamanla zayıfladı, ancak orijinal sabitlemeler hala yeniden mimarisine tabi tutulmamış üretim kodunda duruyor.

Geçiş

Özel instruct varyantının OpenAI ürün yelpazesinde doğrudan bir halefi yok. Completions API, mevcut hiçbir modelin birincil yüzey olarak sunulmayacak kadar azaltıldı.

Eski kod nedenleriyle instruct'a sabitlenmiş iş yükleri için, geçiş mevcut bir modelde sohbet arayüzüne yapılır. GPT-4o mini, sohbet şeklindeki trafik için en yakın davranışsal eşleştirmedir. Prompt yeniden mimarisi işin büyük kısmını oluşturur — bir iş yükü sohbet arayüzünde olduğunda, model yükseltmesinin kendisi bir etiket değiştirmedir.

Logprobs'a bağımlı iş yükleri için, mevcut OpenAI modellerinde sohbet arayüzü ilgili verileri sunar, ancak entegrasyon kalıpları farklıdır. Kısıtlanmış kod çözme veya yapılandırılmış örnekleme yapan ekipler, GPT-4o ve GPT-4.1'deki katı yapılandırılmış çıktılar özelliğini, eski bir instruct modeline karşı logprobs-farkında örneklemeden daha iyi bir uyum bulabilir.

Biçimlendirme tokeni ek yükünün önemli olduğu yüksek hacimli sınıflandırma için, gpt-4.1-nano veya Gemma 3 ailesinden açık ağırlıklı bir model, başka bir instruct tarzı 3.5 varyantından daha iyi bir uyumdur. Mevcut ucuz katman modellerdeki çağrı başına maliyet, 3.5 Turbo fiyat noktasının oldukça altındadır.

Bugün ne yapmalı

gpt-3.5-turbo-instruct hala yığınınızdaysa, geçiş 3.5 ailesindeki daha ağır olanlardan biridir. API yüzeyinin kendisi değişiyor, sadece model değil. Sohbet arayüzü etrafında yeniden mimarilik, bir model tanımlayıcısını değiştirmekten daha fazla iş demektir.

Bunu kasıtlı olarak planlayın. Her çağrı noktasını denetleyin. Her biri için, iş yükünün hala küçük bir modelde mi olması gerektiğine, yoksa doğru hareketin onu mevcut bir sınır veya orta katman modelde çalışan daha geniş bir hatta mı birleştirmek olduğuna karar verin. Dürüstçe denetleyen çoğu ekip, orijinal instruct dağıtımının artık mevcut olmayan bir sorunu çözdüğünü buluyor.

Daha geniş 3.5 bağlamı için, GPT-3.5 Turbo bölümüne bakın. Mevcut OpenAI ürün yelpazesi yönü için, GPT-4.1 bölümüne bakın.

Seçmek

Yeni yapılar için bu varyantı seçmeyin. Completions API, OpenAI ürün yelpazesinde azalıyor ve 3.5 nesli kullanımdan kaldırılmış durumda.

Mevcut entegrasyonlar için, geçiş mevcut bir modelde sohbet arayüzüne yapılır. Kullanımdan kaldırma tarihi gelmeden önce planlayın.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

gpt-3.5-turbo-instruct — illustration 2
Son otomatik test
27 May 2026 · 21:57 UTC · Test
P50 gecikme
P95 gecikme
Hatalar
1 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·26 Mayıs 2026