
gpt-3.5-turbo-instruct: tamamlama tarzı 3.5⚠️ Kullanımdan kaldırılmış model. OpenAI bu modeli emekliye ayırdı. Yeni projeler için, uygun maliyetli genel kullanım için GPT-4o mini veya daha güçlü mantık yürütme için GPT-4.1 modellerine bakın. Mevcut entegrasyonlar, API uç noktası kapanmadan önce geçiş planlaması yapmalıdır.
gpt-3.5-turbo-instruct, GPT-3.5 Turbo varyantıdır ve modeli Chat Completions arayüzü yerine eski Completions API aracılığıyla sunmuştur. Tek metin girişi, metin çıkışı, messages dizisi yok, roller yok, prompt'un etrafına sarılmış sohbet biçimlendirmesi yok — sadece prompt'un kendisi ve modelin onunla devam ettirdiği şey.
Artık kullanımdan kaldırılmıştır. Uç nokta hala yanıt veriyor ancak Completions API yüzeyinin kendisi OpenAI ürün yelpazesinde giderek azalıyor ve bu model anlamlı son direniş noktalarından biri.
Neden ayrı bir varyant var oldu
OpenAI Mart 2023'te GPT-3.5 Turbo'yu piyasaya sürdüğünde, Chat Completions API yeni kalıptı. messages dizisi, sistem rolü, rol tabanlı prompt'lama — bunların hepsi yeni altyapıydı. Dışarıdaki birçok kod, GPT-3 tarafından kullanılan eski Completions API'sine karşı yazılmıştı; burada bir dize gönderirdiniz ve model onu devam ettirirdi.
Bu kodu sohbet arayüzüne geçirmek önemsiz değildi. Prompt'ların yeniden yapılandırılması, rol sınırlarının tanımlanması ve sohbet biçimlendirmesinin model davranışını değiştirdiği sınır durumların hata ayıklanması gerekiyordu. Eski API yüzeyi üzerine inşa edilmiş üretim hattına sahip ekipler için, OpenAI bir köprü olarak gpt-3.5-turbo-instruct'ı gönderdi — normal 3.5 Turbo ile aynı model ağırlıkları, eski API şekli aracılığıyla sunulmuş.
Varyant, özellikle üç iş yükü şekli için faydalıydı. Modelin konuşma yanıtı etrafına sarmaması gereken, tek bir token veya kısa etiket istediğiniz sınıflandırma ve etiketleme hatları. Prompt'un zaten kısmi bir çıktı olduğu ve devamını istediğiniz, sohbet dönüşü değil, kod tamamlama tarzı iş akışları. Completions API'sinin token olasılıklarını sohbet yüzeyinden daha doğrudan sunduğu logprobs'a bağımlı hatlar.
Üçü için de, sohbet arayüzü ek yük ekliyordu — biçimlendirme için ekstra tokenlar, sohbet tarzı yanıtlar üzerinde eğitilmiş olmasıyla şekillenen model davranışı, biraz farklı çıktı stili. Instruct varyantı, bu iş yüklerinin eski yöntemle çalışmaya devam etmesine izin verdi.
Model nasıl davrandı
Ailenin geri kalanıyla aynı 3.5 nesil davranışı. 3.5 seviyesinde mantık yürütme derinliği. Olgusal yollarda geri getirme artırımına veya insan incelemesine ihtiyaç duyan gerçeklik. Bazen aşırı hevesli, bazen de fazla uyumlu olan ret kalibrasyonu.
Sohbet modeli gibi davranmadığı şey buydu. Instruct varyantı, yanıtları konuşma çerçevesine sarmadı, "bir AI asistanı olarak" klişelerini üretmedi, sohbet-eğitimli yöntemlerle çekinmedi. Temiz devam istleyen iş yükleri için, altta yatan yetenek aynı olsa bile normal 3.5 Turbo'dan daha iyi bir uyumdu.
16.385 tokenlik bağlam penceresi, daha geniş 3.5 ailesinden miras alındı.
Neden ekipler instruct'a sabitlendi
Yukarıdaki eski kod nedeninin yanı sıra iki neden.
Birincisi, logprobs erişimi. Completions API, token düzeyinde logprobs'u sohbet arayüzünden daha doğrudan sundu. Kısıtlanmış kod çözme, yapılandırılmış çıktı örnekleme, güven puanlarıyla sınıflandırma veya herhangi bir logprobs-farkında alt akış işi yapan ekipler, bu yüzey için instruct varyantına sabitlendiler. Sohbet arayüzü sonunda benzer yetenekler kazandı, ancak instruct API uzun süre bu tür işler için daha temiz bir şekildi.
İkincisi, daha az biçimlendirme tokeni. Sohbet arayüzü her isteğe birkaç token biçimlendirme ekler, bu da yüksek hacimde birikir. Çok kısa prompt'lar ve çok kısa tamamlamalar olan iş yükleri için, instruct varyantının tokenizasyon ek yükü daha düşüktü, bu da çağrı başına biraz daha ucuz maliyetlere ve biraz daha düşük gecikmeye dönüştü.
Sohbet arayüzü olgunlaştıkça her iki neden de zamanla zayıfladı, ancak orijinal sabitlemeler hala yeniden mimarisine tabi tutulmamış üretim kodunda duruyor.
Geçiş
Özel instruct varyantının OpenAI ürün yelpazesinde doğrudan bir halefi yok. Completions API, mevcut hiçbir modelin birincil yüzey olarak sunulmayacak kadar azaltıldı.
Eski kod nedenleriyle instruct'a sabitlenmiş iş yükleri için, geçiş mevcut bir modelde sohbet arayüzüne yapılır. GPT-4o mini, sohbet şeklindeki trafik için en yakın davranışsal eşleştirmedir. Prompt yeniden mimarisi işin büyük kısmını oluşturur — bir iş yükü sohbet arayüzünde olduğunda, model yükseltmesinin kendisi bir etiket değiştirmedir.
Logprobs'a bağımlı iş yükleri için, mevcut OpenAI modellerinde sohbet arayüzü ilgili verileri sunar, ancak entegrasyon kalıpları farklıdır. Kısıtlanmış kod çözme veya yapılandırılmış örnekleme yapan ekipler, GPT-4o ve GPT-4.1'deki katı yapılandırılmış çıktılar özelliğini, eski bir instruct modeline karşı logprobs-farkında örneklemeden daha iyi bir uyum bulabilir.
Biçimlendirme tokeni ek yükünün önemli olduğu yüksek hacimli sınıflandırma için, gpt-4.1-nano veya Gemma 3 ailesinden açık ağırlıklı bir model, başka bir instruct tarzı 3.5 varyantından daha iyi bir uyumdur. Mevcut ucuz katman modellerdeki çağrı başına maliyet, 3.5 Turbo fiyat noktasının oldukça altındadır.
Bugün ne yapmalı
gpt-3.5-turbo-instruct hala yığınınızdaysa, geçiş 3.5 ailesindeki daha ağır olanlardan biridir. API yüzeyinin kendisi değişiyor, sadece model değil. Sohbet arayüzü etrafında yeniden mimarilik, bir model tanımlayıcısını değiştirmekten daha fazla iş demektir.
Bunu kasıtlı olarak planlayın. Her çağrı noktasını denetleyin. Her biri için, iş yükünün hala küçük bir modelde mi olması gerektiğine, yoksa doğru hareketin onu mevcut bir sınır veya orta katman modelde çalışan daha geniş bir hatta mı birleştirmek olduğuna karar verin. Dürüstçe denetleyen çoğu ekip, orijinal instruct dağıtımının artık mevcut olmayan bir sorunu çözdüğünü buluyor.
Daha geniş 3.5 bağlamı için, GPT-3.5 Turbo bölümüne bakın. Mevcut OpenAI ürün yelpazesi yönü için, GPT-4.1 bölümüne bakın.
Seçmek
Yeni yapılar için bu varyantı seçmeyin. Completions API, OpenAI ürün yelpazesinde azalıyor ve 3.5 nesli kullanımdan kaldırılmış durumda.
Mevcut entegrasyonlar için, geçiş mevcut bir modelde sohbet arayüzüne yapılır. Kullanımdan kaldırma tarihi gelmeden önce planlayın.
Son teknik inceleme: 2026-05-22 — Tokonomix.ai
