¿Por qué elegiría instruct sobre los modelos chat?

Para aplicaciones heredadas que esperan completado de texto, o cuando se necesita control preciso sobre el formato sin overhead de chat.

¿Qué significa el sufijo 0914?

Indica la fecha de snapshot del modelo: 14 de septiembre de 2023, útil para reproducibilidad en integraciones que requieren comportamiento estable.

¿Sigue recibiendo actualizaciones?

Es un modelo fijo con fecha específica; para actualizaciones continuas se recomienda migrar a modelos más recientes de OpenAI.

Se ejecuta en:USCreado en:United States

Archivado

Este modelo ha sido descontinuado por el proveedor. Los datos históricos se conservan.

Ya no está disponible desde el 27 de mayo de 2026.

OpenAI

gpt-3.5-turbo-instruct-0914

Equipo editorial Tokonomix·Revisado por Mes Kalkan·Publicado 22 de mayo de 2026·Última revisión 24 de mayo de 2026

GPT-3.5-turbo-instruct-0914 es un modelo de completado de texto desarrollado por OpenAI, lanzado en septiembre de 2023. A diferencia de las variantes de GPT-3.5-turbo orientadas al chat, este modelo utiliza la arquitectura antigua de seguimiento de instrucciones introducida originalmente con GPT-3, lo que lo hace más adecuado para tareas de completado de un solo turno en lugar de conversaciones de múltiples turnos. Está diseñado para aplicaciones que requieren continuación directa de texto, clasificación, transformación y otras operaciones tradicionales de modelos de lenguaje sin la sobrecarga de formato conversacional. El modelo procesa solicitudes estándar de generación de texto y sigue instrucciones incorporadas dentro de los prompts. Representa una continuación de la línea InstructGPT de OpenAI, que aplica aprendizaje por refuerzo a partir de retroalimentación humana (RLHF) para mejorar las capacidades de seguimiento de instrucciones. La designación "0914" indica la fecha específica de la instantánea del 14 de septiembre de 2023. Aunque OpenAI no ha revelado públicamente el tamaño de su ventana de contexto, se espera que maneje tareas de completado típicas dentro de restricciones de longitud estándar. Dentro de la línea de modelos de OpenAI, gpt-3.5-turbo-instruct-0914 ocupa una posición especializada junto a las variantes de GPT-3.5 y GPT-4 optimizadas para chat más comúnmente utilizadas. Sirve a usuarios que necesitan específicamente salidas de estilo completado en lugar de respuestas conversacionales, lo que lo hace particularmente relevante para aplicaciones heredadas, ciertas integraciones de API y casos de uso donde el paradigma de completado ofrece un control más directo sobre el formato de salida. El modelo proporciona un patrón de interfaz alternativo para desarrolladores que prefieren o requieren el enfoque de completado tradicional sobre las interacciones basadas en chat.

GPT-3.5 Turbo Instruct usa el paradigma de completado clásico, ideal para integrations legacy que esperan salida de texto directa sin formato de chat.
— Resumen de benchmark Tokonomix

Sección 01

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰

Tarifas API — gpt-3.5-turbo-instruct-0914

$1.50 por 1M de tokens de entrada

$2.00 por 1M de tokens de salida

≈ $0.0013 por conversación típica (800 tokens)

Precio entrada vs salida (por 1M de tokens)

por 1M de tokens de entrada$1.50

por 1M de tokens de salida$2.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.50

input / 1M

— no change

$2.00

output / 1M

— no change

2026-05-242026-05-242026-05-24

Input

Output

Price change

⟳ synced weekly

Sección 02

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Interfaz de completado clásicoCompatible con integraciones legacyRespuestas rápidas en formato textoControl directo sobre el formato de salidaIdeal para transformaciones de textoClasificación y extracción de datos

Debilidades

No optimizado para conversación multi-turnoMenor capacidad que GPT-4Ventana de contexto no documentada públicamenteParadigma antiguo, no recomendado para nuevos proyectos

Sección 03

Preguntas frecuentes

Instruct usa completado de texto directo; chat usa formato de mensajes con roles. Instruct es preferible para tareas de transformación de texto.

La única opción moderna de OpenAI que mantiene la interfaz de completado clásico de InstructGPT para compatibilidad con aplicaciones heredadas.
— Resumen de benchmark Tokonomix

Sección 04

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 05

Veredictos del benchmark Tokonomix

● 2026-05-24

Línea base establecida para el modelo de seguimiento de instrucciones GPT-3.5 Turbo Instruct

Esta es la primera evaluación de benchmark para gpt-3.5-turbo-instruct-0914, estableciendo métricas de rendimiento de referencia para comparaciones futuras. Como variante orientada al seguimiento de instrucciones de GPT-3.5 Turbo, optimizada para tareas de completado de un solo turno en lugar de conversación, este modelo cumple un caso de uso específico dentro de la línea de modelos de OpenAI. Sin datos previos con los que contrastar, este veredicto se centra en establecer la huella de rendimiento inicial. Los usuarios deben tener en cuenta que este modelo difiere del GPT-3.5 Turbo estándar en su filosofía de diseño, priorizando el cumplimiento directo de instrucciones sobre las interacciones conversacionales. La variante instruct suele destacar en la ejecución directa de tareas, clasificación y generación de salidas estructuradas, donde un prompt explícito produce resultados predecibles. Al tratarse de una instantánea de septiembre de 2014, los usuarios pueden esperar un comportamiento estable en aplicaciones que requieran capacidades consistentes de seguimiento de instrucciones. Los próximos veredictos darán seguimiento a cualquier variación de rendimiento, mejora de capacidades o cambio de comportamiento frente a esta línea base establecida. Las organizaciones que desarrollen aplicaciones en producción deberían monitorear los benchmarks posteriores para comprender cómo evoluciona este modelo en relación con estas mediciones iniciales.

Quality

—

Latency p50

—

Test runs

✓ Métricas de referencia establecidas✓ Optimización de seguimiento de instrucciones confirmada

Sección 06

Perfil completo del modelo

⚠️ Modelo obsoleto. OpenAI ha retirado este modelo. Para nuevos proyectos, consulte GPT-4o mini para uso general rentable o GPT-4.1 para un razonamiento más sólido. Las integraciones existentes deben planificar la migración antes de que el endpoint de la API sea discontinuado.

gpt-3.5-turbo-instruct-0914: la instantánea instruct anclada

gpt-3.5-turbo-instruct-0914 es la instantánea con fecha del GPT-3.5 Turbo de estilo instruct de OpenAI, congelada en la versión del 14 de septiembre de 2023. Es el identificador anclado para la variante que exponía el 3.5 a través de la API de Completions heredada en lugar de la interfaz de chat.

El modelo está obsoleto. La propia superficie de la API de Completions está siendo retirada gradualmente en toda la línea de OpenAI. Los nuevos proyectos no deberían apuntar a este identificador.

Por qué importa esta fecha específica

La versión de septiembre de 2023 fue la instantánea a la que la mayoría de los equipos de producción terminaron anclando cuando necesitaban reproducibilidad contra la variante instruct. La versión es anterior a los cambios más grandes de la familia 3.5 que llegaron con la actualización DevDay de noviembre de 2023: sin modo JSON, sin llamadas a funciones paralelas, nada de eso. Lo que tenía era un modelo estable y bien entendido contra el que la primera generación de productos respaldados por LLM había sido construida.

Para los equipos que presentaron evaluaciones o escribieron contratos de proveedor haciendo referencia a la variante instruct, esta instantánea es a menudo la nombrada. Para los flujos de trabajo de investigación que necesitaban reproducibilidad contra el modelo usado en un artículo o benchmark específico de finales de 2023, este es frecuentemente el identificador.

El panorama más amplio es que la variante instruct existía precisamente para dar a código escrito contra la antigua API de Completions una ruta a seguir sin forzar una re-arquitectura de la interfaz de chat. Anclar a una instantánea específica de esa variante es doblemente conservador: tanto la superficie de la API como el comportamiento del modelo están congelados en el tiempo.

Qué incluye esta instantánea

La variante instruct de GPT-3.5 Turbo tal como estaba en septiembre de 2023. Ventana de contexto de 16 385 tokens. Entrada de prompt de cadena única a través de la API de Completions heredada, salida de completación de cadena única. Logprobs disponibles directamente a través de la API. Sin formato de chat, sin prompting basado en roles, ninguno de los patrones de respuesta entrenados para el chat.

Lo que no está en esta instantánea es nada que llegara en versiones 3.5 posteriores. Sin modo JSON. Sin llamadas a funciones paralelas. Sin parámetro de semilla para la reproducibilidad: lo cual es levemente irónico dado que esta es la instantánea anclada con fines de reproducibilidad; se obtiene estabilidad de pesos del modelo sin las herramientas de reproducibilidad a nivel de API.

El comportamiento del modelo es la generación 3.5. Profundidad de razonamiento a ese nivel. Factualidad que necesitaba recuperación o revisión en las rutas factuales. Calibración de rechazos que era menos consistente que lo que llegó después.

Por qué los equipos siguen anclados a ella

Tres razones aparecen en las auditorías.

Primera, dependencias de código posterior en logprobs de esta instantánea. Los pipelines de clasificación, los sistemas de decodificación restringida y el trabajo de muestreo estructurado construidos alrededor de las distribuciones de logprob específicas de la instantánea de septiembre pueden regresar cuando se actualiza. El comportamiento del modelo de instantáneas posteriores es similar pero las distribuciones de probabilidad no son idénticas, y los pipelines posteriores ajustados con suficiente precisión como para sentir la diferencia son pegajosos.

Segunda, flujos de trabajo regulados que aprobaron exactamente este identificador. Algunas revisiones de cumplimiento de finales de 2023 nombraron la instantánea de septiembre específicamente y el ciclo de re-aprobación es suficientemente lento como para que el anclaje no se haya movido.

Tercera, reproducibilidad de investigación. Los artículos y evaluaciones internas de finales de 2023 que usaron la variante instruct a menudo hacen referencia a esta instantánea aunque no lo digan explícitamente. El anclaje permite que esos resultados sigan siendo reproducibles.

Qué significa el calendario de obsolescencia

Esta es una de las instantáneas más antiguas que aún responden en la línea OpenAI. Los horizontes de obsolescencia para las instantáneas con fecha se ejecutan entre doce y dieciocho meses según el calendario típico de OpenAI. Septiembre de 2023 está muy por encima del extremo temprano de esa ventana. El hecho de que el endpoint siga respondiendo hoy no es una garantía de que responda mañana.

La urgencia de migración es real. Planifíquela activamente. Configure un recordatorio de calendario. Tenga en cuenta que el objetivo de migración no es otra instantánea instruct: la superficie de la API de Completions está siendo retirada, por lo que la migración es a la interfaz de chat en un modelo actual, con el trabajo arquitectónico que eso implica.

Migración

El mismo patrón que aplica a la variante instruct más amplia aplica aquí, con la restricción adicional de que se migra desde una instantánea congelada en lugar de desde el identificador flotante.

Para las cargas de trabajo ancladas a distribuciones de logprob, evalúe si el trabajo posterior puede moverse a la característica de salidas estructuradas estrictas en los modelos OpenAI actuales. El cumplimiento del esquema en la capa de inferencia es a menudo un reemplazo más limpio para el muestreo consciente de logprobs que perseguir un modelo instruct sucesor que no existe.

Para las cargas de trabajo ancladas por cumplimiento, el ciclo de re-aprobación es parte del coste de migración. Comience la conversación con los auditores antes de que se anuncie la fecha de obsolescencia; hacerlo bajo presión de tiempo es más caro.

Para las cargas de trabajo ancladas por reproducibilidad de investigación, la respuesta práctica es publicar números de referencia contra un modelo actual junto con los números históricos, luego hacer la transición del pipeline de producción. Los resultados históricos siguen siendo reproducibles contra las instantáneas archivadas y las salidas registradas; el sistema en vivo corre contra los pesos actuales.

Para el contexto del instruct flotante, consulte gpt-3.5-turbo-instruct. Para la línea OpenAI actual, consulte GPT-4.1 y GPT-4o mini.

Qué hacer hoy

Si este identificador sigue en su código, los pasos son concretos.

Primero, encuentre el sitio de llamada y documente por qué existe el anclaje. Las razones anteriores son las comunes; la razón de su equipo puede ser más específica.

Segundo, ejecute una evaluación real contra su candidato de migración. Los modelos más recientes y la interfaz de chat necesitan un prompting diferente; mantener los patrones de la era instruct puede hacer que un sucesor parezca peor de lo que es.

Tercero, planifique la transición para una ventana de lanzamiento de su elección, no bajo la presión de la obsolescencia. La instantánea de septiembre de 2023 está en el extremo más antiguo de la línea OpenAI. La fecha de obsolescencia está más cerca que la fecha de lanzamiento.

Cuándo elegirlo

No elija esta instantánea para nuevas construcciones. Está obsoleta y la propia superficie de la API está siendo retirada.

Para las integraciones existentes, el objetivo de migración es un modelo con interfaz de chat actual: GPT-4o mini para el tráfico con forma de chat, GPT-4.1 o GPT-4.1 mini para las cargas de trabajo donde el techo de razonamiento de 3.5 ya era una restricción. Planifique deliberadamente.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

Última prueba automática

27 may 2026 · 21:57 UTC · Benchmark

Latencia P50

—

Latencia P95

—

Errores

1 / 6 ejecuciones

Última revisión por Equipo Tokonomix·24 de mayo de 2026