
gpt-3.5-turbo-instruct-0914: la instantánea instruct anclada⚠️ Modelo obsoleto. OpenAI ha retirado este modelo. Para nuevos proyectos, consulte GPT-4o mini para uso general rentable o GPT-4.1 para un razonamiento más sólido. Las integraciones existentes deben planificar la migración antes de que el endpoint de la API sea discontinuado.
gpt-3.5-turbo-instruct-0914 es la instantánea con fecha del GPT-3.5 Turbo de estilo instruct de OpenAI, congelada en la versión del 14 de septiembre de 2023. Es el identificador anclado para la variante que exponía el 3.5 a través de la API de Completions heredada en lugar de la interfaz de chat.
El modelo está obsoleto. La propia superficie de la API de Completions está siendo retirada gradualmente en toda la línea de OpenAI. Los nuevos proyectos no deberían apuntar a este identificador.
Por qué importa esta fecha específica
La versión de septiembre de 2023 fue la instantánea a la que la mayoría de los equipos de producción terminaron anclando cuando necesitaban reproducibilidad contra la variante instruct. La versión es anterior a los cambios más grandes de la familia 3.5 que llegaron con la actualización DevDay de noviembre de 2023: sin modo JSON, sin llamadas a funciones paralelas, nada de eso. Lo que tenía era un modelo estable y bien entendido contra el que la primera generación de productos respaldados por LLM había sido construida.
Para los equipos que presentaron evaluaciones o escribieron contratos de proveedor haciendo referencia a la variante instruct, esta instantánea es a menudo la nombrada. Para los flujos de trabajo de investigación que necesitaban reproducibilidad contra el modelo usado en un artículo o benchmark específico de finales de 2023, este es frecuentemente el identificador.
El panorama más amplio es que la variante instruct existía precisamente para dar a código escrito contra la antigua API de Completions una ruta a seguir sin forzar una re-arquitectura de la interfaz de chat. Anclar a una instantánea específica de esa variante es doblemente conservador: tanto la superficie de la API como el comportamiento del modelo están congelados en el tiempo.
Qué incluye esta instantánea
La variante instruct de GPT-3.5 Turbo tal como estaba en septiembre de 2023. Ventana de contexto de 16 385 tokens. Entrada de prompt de cadena única a través de la API de Completions heredada, salida de completación de cadena única. Logprobs disponibles directamente a través de la API. Sin formato de chat, sin prompting basado en roles, ninguno de los patrones de respuesta entrenados para el chat.
Lo que no está en esta instantánea es nada que llegara en versiones 3.5 posteriores. Sin modo JSON. Sin llamadas a funciones paralelas. Sin parámetro de semilla para la reproducibilidad: lo cual es levemente irónico dado que esta es la instantánea anclada con fines de reproducibilidad; se obtiene estabilidad de pesos del modelo sin las herramientas de reproducibilidad a nivel de API.
El comportamiento del modelo es la generación 3.5. Profundidad de razonamiento a ese nivel. Factualidad que necesitaba recuperación o revisión en las rutas factuales. Calibración de rechazos que era menos consistente que lo que llegó después.
Por qué los equipos siguen anclados a ella
Tres razones aparecen en las auditorías.
Primera, dependencias de código posterior en logprobs de esta instantánea. Los pipelines de clasificación, los sistemas de decodificación restringida y el trabajo de muestreo estructurado construidos alrededor de las distribuciones de logprob específicas de la instantánea de septiembre pueden regresar cuando se actualiza. El comportamiento del modelo de instantáneas posteriores es similar pero las distribuciones de probabilidad no son idénticas, y los pipelines posteriores ajustados con suficiente precisión como para sentir la diferencia son pegajosos.
Segunda, flujos de trabajo regulados que aprobaron exactamente este identificador. Algunas revisiones de cumplimiento de finales de 2023 nombraron la instantánea de septiembre específicamente y el ciclo de re-aprobación es suficientemente lento como para que el anclaje no se haya movido.
Tercera, reproducibilidad de investigación. Los artículos y evaluaciones internas de finales de 2023 que usaron la variante instruct a menudo hacen referencia a esta instantánea aunque no lo digan explícitamente. El anclaje permite que esos resultados sigan siendo reproducibles.
Qué significa el calendario de obsolescencia
Esta es una de las instantáneas más antiguas que aún responden en la línea OpenAI. Los horizontes de obsolescencia para las instantáneas con fecha se ejecutan entre doce y dieciocho meses según el calendario típico de OpenAI. Septiembre de 2023 está muy por encima del extremo temprano de esa ventana. El hecho de que el endpoint siga respondiendo hoy no es una garantía de que responda mañana.
La urgencia de migración es real. Planifíquela activamente. Configure un recordatorio de calendario. Tenga en cuenta que el objetivo de migración no es otra instantánea instruct: la superficie de la API de Completions está siendo retirada, por lo que la migración es a la interfaz de chat en un modelo actual, con el trabajo arquitectónico que eso implica.
Migración
El mismo patrón que aplica a la variante instruct más amplia aplica aquí, con la restricción adicional de que se migra desde una instantánea congelada en lugar de desde el identificador flotante.
Para las cargas de trabajo ancladas a distribuciones de logprob, evalúe si el trabajo posterior puede moverse a la característica de salidas estructuradas estrictas en los modelos OpenAI actuales. El cumplimiento del esquema en la capa de inferencia es a menudo un reemplazo más limpio para el muestreo consciente de logprobs que perseguir un modelo instruct sucesor que no existe.
Para las cargas de trabajo ancladas por cumplimiento, el ciclo de re-aprobación es parte del coste de migración. Comience la conversación con los auditores antes de que se anuncie la fecha de obsolescencia; hacerlo bajo presión de tiempo es más caro.
Para las cargas de trabajo ancladas por reproducibilidad de investigación, la respuesta práctica es publicar números de referencia contra un modelo actual junto con los números históricos, luego hacer la transición del pipeline de producción. Los resultados históricos siguen siendo reproducibles contra las instantáneas archivadas y las salidas registradas; el sistema en vivo corre contra los pesos actuales.
Para el contexto del instruct flotante, consulte gpt-3.5-turbo-instruct. Para la línea OpenAI actual, consulte GPT-4.1 y GPT-4o mini.
Qué hacer hoy
Si este identificador sigue en su código, los pasos son concretos.
Primero, encuentre el sitio de llamada y documente por qué existe el anclaje. Las razones anteriores son las comunes; la razón de su equipo puede ser más específica.
Segundo, ejecute una evaluación real contra su candidato de migración. Los modelos más recientes y la interfaz de chat necesitan un prompting diferente; mantener los patrones de la era instruct puede hacer que un sucesor parezca peor de lo que es.
Tercero, planifique la transición para una ventana de lanzamiento de su elección, no bajo la presión de la obsolescencia. La instantánea de septiembre de 2023 está en el extremo más antiguo de la línea OpenAI. La fecha de obsolescencia está más cerca que la fecha de lanzamiento.
Cuándo elegirlo
No elija esta instantánea para nuevas construcciones. Está obsoleta y la propia superficie de la API está siendo retirada.
Para las integraciones existentes, el objetivo de migración es un modelo con interfaz de chat actual: GPT-4o mini para el tráfico con forma de chat, GPT-4.1 o GPT-4.1 mini para las cargas de trabajo donde el techo de razonamiento de 3.5 ya era una restricción. Planifique deliberadamente.
Última revisión técnica: 2026-05-22 — Tokonomix.ai
