
gpt-3.5-turbo-1106: la instantánea que introdujo el modo JSON⚠️ Modelo obsoleto. OpenAI ha retirado este modelo. Para nuevos proyectos, consulte GPT-4o mini para uso general rentable o GPT-4.1 para un razonamiento más sólido. Las integraciones existentes deben planificar la migración antes de que el endpoint de la API sea discontinuado.
gpt-3.5-turbo-1106 es la instantánea con fecha de GPT-3.5 Turbo lanzada el 6 de noviembre de 2023. Fue el lanzamiento de OpenAI DevDay: el modelo que trajo el modo JSON, las llamadas a funciones paralelas y los parámetros de semilla para la reproducibilidad a la línea 3.5.
El modelo está obsoleto ahora. El identificador anclado sigue resolviendo pero las nuevas construcciones deberían apuntar a un modelo actual.
Qué se lanzó en esta versión
El lanzamiento del 6 de noviembre de 2023 fue menos sobre mejoras en los pesos del modelo y más sobre características de la superficie de la API. La línea 3.5 estaba alcanzando un tipo de madurez; OpenAI usó este lanzamiento para añadir los controles de tiempo de despliegue que los equipos de producción habían estado pidiendo.
Modo JSON. Antes de 1106, obtener JSON fiable de 3.5 Turbo significaba ingeniería de prompts y un parser defensivo. La versión 1106 añadió un indicador que restringía la generación a JSON válido. La restricción no era el cumplimiento estricto del esquema —eso llegó después— pero era suficiente para hacer fiables las salidas con forma de JSON sin trucos en la capa de prompts. Para los pipelines de extracción de datos que habían estado trabajando alrededor del comportamiento anterior, esto fue una simplificación real.
Llamadas a funciones paralelas. El soporte de llamadas a funciones anterior en 3.5 era secuencial: el modelo podía solicitar una llamada a herramienta a la vez, y había que volver al modelo para la siguiente. La versión 1106 añadió la capacidad de que el modelo solicitara múltiples llamadas a herramientas en una sola respuesta. Los bucles de agentes que antes necesitaban N ida y vueltas para N llamadas a herramientas podían colapsar en una.
Reproducibilidad. El parámetro seed llegó en esta versión. Pase la misma semilla y el mismo prompt, obtenga la misma salida la mayoría de las veces. La parte "la mayoría de las veces" es importante: el parámetro mejoró la reproducibilidad sin garantizarla, porque el no-determinismo del stack de inferencia seguía filtrándose. Pero para el trabajo de evaluación y depuración, la semilla era suficientemente útil como para que la mayoría de los equipos de producción comenzaran a usarla.
Qué permaneció igual
El comportamiento del modelo subyacente. 1106 era la generación 3.5 bajo el capó. Profundidad de razonamiento, factualidad, calibración de rechazos: todo prácticamente igual que las instantáneas inmediatamente anteriores. La versión fue sobre la ergonomía del despliegue, no sobre hacer el modelo más inteligente.
Ventana de contexto. 16 385 tokens. Suficientemente larga para la mayoría del tráfico de chat, suficientemente corta para que las cargas de trabajo de documentos largos toparan con el límite regularmente.
Perfil de coste. Los precios de la familia 3.5 siguieron anclando el extremo barato de la línea OpenAI.
Por qué los equipos anclaron a 1106
Para las cargas de trabajo que dependían de las características de la API que introdujo esta instantánea, 1106 era el anclaje correcto durante finales de 2023 y hasta 2024.
Pipelines dependientes del modo JSON. Cualquier equipo que construyó alrededor del nuevo modo JSON en noviembre de 2023 quería reproducibilidad frente a la instantánea específica que lo introdujo. El comportamiento era ligeramente diferente de las versiones posteriores, y los parsers posteriores ajustados a 1106 podían regresar cuando se actualizaban.
Bucles de agentes con múltiples herramientas. Los frameworks de agentes tempranos que aprovecharon las llamadas a funciones paralelas anclaron a 1106 porque el comportamiento específico del patrón de llamadas —cuándo el modelo agrupaba las llamadas, cómo las ordenaba, qué argumentos producía— era sensible a la instantánea.
Evaluaciones dependientes de la reproducibilidad. Los flujos de trabajo de investigación y CI que comenzaron a usar el parámetro de semilla en noviembre de 2023 a menudo anclaron a 1106 porque el comportamiento del parámetro era suficientemente nuevo como para que el equipo no quisiera también variar la instantánea del modelo en el mismo experimento.
La instantánea 0125, lanzada dos meses y medio después, era una versión más pulida del mismo conjunto de características. La mayoría del tráfico de producción que comenzó en 1106 acabó moviéndose a 0125 dentro de un trimestre.
Objetivos de migración
Para las cargas de trabajo dependientes del modo JSON, la característica de salidas estructuradas estrictas que llegó en la instantánea GPT-4o de agosto de 2024 y en toda la familia GPT-4.1 es el mejor objetivo que otra instantánea 3.5. El cumplimiento del esquema en la capa de inferencia es notablemente más fiable que el modo JSON con parsing defensivo.
Para las cargas de trabajo de bucles de agentes construidas sobre llamadas a funciones paralelas, el mismo patrón de llamadas funciona en GPT-4o, GPT-4.1 y la variante mini 4.1. La diferencia de comportamiento es suficientemente pequeña como para que la migración sea normalmente un cambio de etiqueta más una re-evaluación.
Para los flujos de trabajo de evaluación dependientes de la reproducibilidad, el parámetro de semilla es soportado en toda la línea OpenAI actual. Moverse de 1106 a un modelo actual significa establecer de nuevo la referencia de las salidas de evaluación seeded frente al nuevo modelo; el parámetro en sí no cambia.
Qué hacer hoy
Si 1106 sigue anclado en su stack, los elementos de acción reflejan el resto de la familia 3.5. Audite la carga de trabajo para confirmar que el anclaje sigue justificándose. Ejecute una evaluación medida frente al candidato de migración. Planifique la transición para una ventana de lanzamiento de su elección en lugar de bajo la presión de la obsolescencia.
El caso específico de 1106 a vigilar es el código posterior que depende del comportamiento temprano de llamadas a funciones paralelas. Algunos frameworks de agentes que crecieron frente a esta instantánea tienen casos extremos en cómo analizan las respuestas de múltiples herramientas que son técnicamente válidas frente a modelos posteriores pero comportamentalmente diferentes. Vuelva a probar los bucles, no solo el modelo.
Para la comparación entre categorías, consulte /benchmarks/leaderboard. Para el contexto del identificador flotante 3.5, consulte GPT-3.5 Turbo.
Cuándo elegirlo
No elija esta instantánea para nuevas construcciones. La familia 3.5 está obsoleta.
Para las integraciones 1106 existentes, los sucesores naturales son GPT-4o mini para el tráfico de chat general y GPT-4.1 mini o GPT-4.1 completo para cargas de trabajo donde el techo de razonamiento de la generación 3.5 ya era una restricción. Planifique la migración antes de que llegue la fecha de obsolescencia.
Última revisión técnica: 2026-05-22 — Tokonomix.ai

