¿Qué mejoras específicas incluye la versión 1106?

Esta versión, lanzada en noviembre 2023, incorpora mejoras en el seguimiento de instrucciones y rendimiento general comparado con versiones anteriores de GPT-3.5. OpenAI ha optimizado el modelo para manejar instrucciones complejas con mayor precisión.

¿Este modelo soporta llamadas a funciones (function calling)?

Sí, GPT-3.5 Turbo 1106 incluye soporte para function calling, permitiendo integración estructurada con APIs y herramientas externas en tus aplicaciones.

¿Cuál es la ventana de contexto disponible?

Si bien las especificaciones exactas no están confirmadas en la documentación actual, las versiones GPT-3.5 Turbo típicamente ofrecen ventanas de contexto suficientes para conversaciones multi-turno y documentos de longitud moderada.

¿Qué tan bien maneja idiomas distintos al inglés?

El modelo demuestra competencia sólida en múltiples idiomas, incluyendo español, francés, alemán y otros idiomas principales. Sin embargo, el rendimiento puede variar según el idioma específico y la complejidad de la tarea.

Tier C — Especialista

Se ejecuta en:USCreado en:United States

OpenAI

gpt-3.5-turbo-1106

Tier C — Especialista

Equipo editorial Tokonomix·Revisado por Mes Kalkan·Publicado 22 de mayo de 2026·Última revisión 24 de mayo de 2026

GPT-3.5 Turbo 1106 es un modelo de lenguaje grande desarrollado por OpenAI, lanzado en noviembre de 2023 como parte de la familia GPT-3.5. Este modelo representa una mejora iterativa sobre versiones anteriores de GPT-3.5, incorporando capacidades mejoradas de seguimiento de instrucciones y un rendimiento superior en diversas tareas de procesamiento de lenguaje natural. Utiliza una arquitectura basada en transformadores entrenada con datos de texto diversos de internet, aunque OpenAI no ha revelado públicamente el recuento exacto de parámetros ni las especificaciones detalladas de entrenamiento. El modelo está diseñado para aplicaciones de generación de texto de propósito general, incluyendo IA conversacional, creación de contenido, resumen, traducción y tareas de respuesta a preguntas. Procesa entradas de texto y genera respuestas similares a las humanas basándose en los patrones aprendidos durante el entrenamiento. GPT-3.5 Turbo 1106 admite interacciones estándar basadas en texto y puede manejar instrucciones complejas mientras mantiene el contexto a lo largo de conversaciones de múltiples turnos. El modelo demuestra competencia en múltiples dominios e idiomas, aunque el rendimiento puede variar dependiendo de la tarea específica y el idioma. Dentro de la línea de modelos de OpenAI, GPT-3.5 Turbo 1106 se sitúa por debajo de la serie más avanzada GPT-4 en términos de capacidades y rendimiento de razonamiento. Sirve como una opción competente para aplicaciones donde no se requiere la sofisticación adicional de los modelos GPT-4. El modelo es accesible a través de la API de OpenAI y ha sido integrado en diversas aplicaciones y servicios. Esta versión reemplazó iteraciones anteriores de GPT-3.5 Turbo, ofreciendo mayor confiabilidad y funciones de llamada a funciones mejoradas para desarrolladores que construyen aplicaciones impulsadas por IA.

GPT-3.5 Turbo 1106 representa el equilibrio entre capacidad y accesibilidad en la familia GPT-3.5, ofreciendo mejoras significativas en seguimiento de instrucciones respecto a versiones anteriores.
— Análisis comparativo Tokonomix

Sección 01

Puntuaciones de calidad

Resultados de evaluación de modelos juez en diversas categorías de tareas. Las puntuaciones reflejan coherencia, precisión y seguimiento de instrucciones.

Creativo

Factual

100

Multilingüe

Razonamiento

Sección 02

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰

Tarifas API — gpt-3.5-turbo-1106

$1.00 por 1M de tokens de entrada

$2.00 por 1M de tokens de salida

≈ $0.0010 por conversación típica (800 tokens)

Precio entrada vs salida (por 1M de tokens)

por 1M de tokens de entrada$1.00

por 1M de tokens de salida$2.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.00

input / 1M

— stable

$2.00

output / 1M

— stable

2026-05-242026-06-282026-07-26

Input

Output

Price change

⟳ synced weekly

Sección 03

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Seguimiento mejorado de instrucciones complejasConversaciones multi-turno coherentesSoporte robusto multilingüeTiempos de respuesta rápidosIntegración directa via API OpenAIGeneración versátil de contenidoActualizaciones iterativas documentadasAmplia adopción y ejemplos comunitarios

Debilidades

Razonamiento inferior a GPT-4Fecha de corte de conocimiento limitadaSin acceso a herramientas externasEspecificaciones técnicas no divulgadas públicamente

Sección 04

Capacidades

toolssource: litellmparallel toolsprompt cachingmax output tokens: 4096

Sección 05

Preguntas frecuentes

GPT-3.5 Turbo 1106 es adecuado para tareas conversacionales generales, generación de contenido y casos donde la velocidad de respuesta es prioritaria. Si tu aplicación requiere razonamiento complejo, análisis profundo o tareas matemáticas avanzadas, GPT-4 ofrece capacidades superiores.

Para equipos que buscan un modelo conversacional confiable sin necesitar las capacidades de razonamiento más avanzadas, esta versión ofrece un punto de entrada sólido dentro del ecosistema OpenAI.
— Evaluación técnica Tokonomix

Sección 06

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 07

Veredictos del benchmark Tokonomix

⚖️

Endorsed by 2 judges

Independent LLM judges evaluated this model on our weekly intelligence tests

cohere/command-a100/100 · 1 runs

1 correct0 partial0 wrong100% accuracy

claude-sonnet-4-584/100 · 111 runs

76 correct18 partial17 wrong68% accuracy

● 2026-07-26

Tool calling capabilities added; no performance data available

GPT-3.5-turbo-1106 has gained several new capabilities since the previous benchmark window, most notably the addition of tools, parallel_tools, and prompt_caching features. These additions represent meaningful functional enhancements that expand the model's utility for developers building applications that require function calling and structured interactions. The parallel tools capability in particular allows for more efficient multi-step workflows. However, the absence of performance metrics in both the current and previous benchmark windows makes it impossible to assess how these new features impact the model's actual task performance, response quality, latency, or throughput. Without concrete benchmark data on accuracy, reasoning ability, or speed, users cannot determine whether this version represents an improvement, regression, or lateral move in core model performance compared to earlier iterations. The model continues to serve as OpenAI's faster, more cost-effective option in the GPT-3.5 family, but potential users should be aware that the lack of standardized benchmark results limits the ability to make informed comparisons with competing models or to validate fitness for specific use cases.

Quality

—

Latency p50

—

Test runs

✓ Tool calling support added✓ Parallel tools capability enabled✓ Prompt caching now available✗ No performance metrics available

Sección 08

Perfil completo del modelo

⚠️ Modelo obsoleto. OpenAI ha retirado este modelo. Para nuevos proyectos, consulte GPT-4o mini para uso general rentable o GPT-4.1 para un razonamiento más sólido. Las integraciones existentes deben planificar la migración antes de que el endpoint de la API sea discontinuado.

gpt-3.5-turbo-1106: la instantánea que introdujo el modo JSON

gpt-3.5-turbo-1106 es la instantánea con fecha de GPT-3.5 Turbo lanzada el 6 de noviembre de 2023. Fue el lanzamiento de OpenAI DevDay: el modelo que trajo el modo JSON, las llamadas a funciones paralelas y los parámetros de semilla para la reproducibilidad a la línea 3.5.

El modelo está obsoleto ahora. El identificador anclado sigue resolviendo pero las nuevas construcciones deberían apuntar a un modelo actual.

Qué se lanzó en esta versión

El lanzamiento del 6 de noviembre de 2023 fue menos sobre mejoras en los pesos del modelo y más sobre características de la superficie de la API. La línea 3.5 estaba alcanzando un tipo de madurez; OpenAI usó este lanzamiento para añadir los controles de tiempo de despliegue que los equipos de producción habían estado pidiendo.

Modo JSON. Antes de 1106, obtener JSON fiable de 3.5 Turbo significaba ingeniería de prompts y un parser defensivo. La versión 1106 añadió un indicador que restringía la generación a JSON válido. La restricción no era el cumplimiento estricto del esquema —eso llegó después— pero era suficiente para hacer fiables las salidas con forma de JSON sin trucos en la capa de prompts. Para los pipelines de extracción de datos que habían estado trabajando alrededor del comportamiento anterior, esto fue una simplificación real.

Llamadas a funciones paralelas. El soporte de llamadas a funciones anterior en 3.5 era secuencial: el modelo podía solicitar una llamada a herramienta a la vez, y había que volver al modelo para la siguiente. La versión 1106 añadió la capacidad de que el modelo solicitara múltiples llamadas a herramientas en una sola respuesta. Los bucles de agentes que antes necesitaban N ida y vueltas para N llamadas a herramientas podían colapsar en una.

Reproducibilidad. El parámetro seed llegó en esta versión. Pase la misma semilla y el mismo prompt, obtenga la misma salida la mayoría de las veces. La parte "la mayoría de las veces" es importante: el parámetro mejoró la reproducibilidad sin garantizarla, porque el no-determinismo del stack de inferencia seguía filtrándose. Pero para el trabajo de evaluación y depuración, la semilla era suficientemente útil como para que la mayoría de los equipos de producción comenzaran a usarla.

Qué permaneció igual

El comportamiento del modelo subyacente. 1106 era la generación 3.5 bajo el capó. Profundidad de razonamiento, factualidad, calibración de rechazos: todo prácticamente igual que las instantáneas inmediatamente anteriores. La versión fue sobre la ergonomía del despliegue, no sobre hacer el modelo más inteligente.

Ventana de contexto. 16 385 tokens. Suficientemente larga para la mayoría del tráfico de chat, suficientemente corta para que las cargas de trabajo de documentos largos toparan con el límite regularmente.

Perfil de coste. Los precios de la familia 3.5 siguieron anclando el extremo barato de la línea OpenAI.

Por qué los equipos anclaron a 1106

Para las cargas de trabajo que dependían de las características de la API que introdujo esta instantánea, 1106 era el anclaje correcto durante finales de 2023 y hasta 2024.

Pipelines dependientes del modo JSON. Cualquier equipo que construyó alrededor del nuevo modo JSON en noviembre de 2023 quería reproducibilidad frente a la instantánea específica que lo introdujo. El comportamiento era ligeramente diferente de las versiones posteriores, y los parsers posteriores ajustados a 1106 podían regresar cuando se actualizaban.

Bucles de agentes con múltiples herramientas. Los frameworks de agentes tempranos que aprovecharon las llamadas a funciones paralelas anclaron a 1106 porque el comportamiento específico del patrón de llamadas —cuándo el modelo agrupaba las llamadas, cómo las ordenaba, qué argumentos producía— era sensible a la instantánea.

Evaluaciones dependientes de la reproducibilidad. Los flujos de trabajo de investigación y CI que comenzaron a usar el parámetro de semilla en noviembre de 2023 a menudo anclaron a 1106 porque el comportamiento del parámetro era suficientemente nuevo como para que el equipo no quisiera también variar la instantánea del modelo en el mismo experimento.

La instantánea 0125, lanzada dos meses y medio después, era una versión más pulida del mismo conjunto de características. La mayoría del tráfico de producción que comenzó en 1106 acabó moviéndose a 0125 dentro de un trimestre.

Objetivos de migración

Para las cargas de trabajo dependientes del modo JSON, la característica de salidas estructuradas estrictas que llegó en la instantánea GPT-4o de agosto de 2024 y en toda la familia GPT-4.1 es el mejor objetivo que otra instantánea 3.5. El cumplimiento del esquema en la capa de inferencia es notablemente más fiable que el modo JSON con parsing defensivo.

Para las cargas de trabajo de bucles de agentes construidas sobre llamadas a funciones paralelas, el mismo patrón de llamadas funciona en GPT-4o, GPT-4.1 y la variante mini 4.1. La diferencia de comportamiento es suficientemente pequeña como para que la migración sea normalmente un cambio de etiqueta más una re-evaluación.

Para los flujos de trabajo de evaluación dependientes de la reproducibilidad, el parámetro de semilla es soportado en toda la línea OpenAI actual. Moverse de 1106 a un modelo actual significa establecer de nuevo la referencia de las salidas de evaluación seeded frente al nuevo modelo; el parámetro en sí no cambia.

Qué hacer hoy

Si 1106 sigue anclado en su stack, los elementos de acción reflejan el resto de la familia 3.5. Audite la carga de trabajo para confirmar que el anclaje sigue justificándose. Ejecute una evaluación medida frente al candidato de migración. Planifique la transición para una ventana de lanzamiento de su elección en lugar de bajo la presión de la obsolescencia.

El caso específico de 1106 a vigilar es el código posterior que depende del comportamiento temprano de llamadas a funciones paralelas. Algunos frameworks de agentes que crecieron frente a esta instantánea tienen casos extremos en cómo analizan las respuestas de múltiples herramientas que son técnicamente válidas frente a modelos posteriores pero comportamentalmente diferentes. Vuelva a probar los bucles, no solo el modelo.

Para la comparación entre categorías, consulte /benchmarks/leaderboard. Para el contexto del identificador flotante 3.5, consulte GPT-3.5 Turbo.

Cuándo elegirlo

No elija esta instantánea para nuevas construcciones. La familia 3.5 está obsoleta.

Para las integraciones 1106 existentes, los sucesores naturales son GPT-4o mini para el tráfico de chat general y GPT-4.1 mini o GPT-4.1 completo para cargas de trabajo donde el techo de razonamiento de la generación 3.5 ya era una restricción. Planifique la migración antes de que llegue la fecha de obsolescencia.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

Última prueba automática

26 jul 2026 · 05:30 UTC · Benchmark

Latencia P50

1249 ms

Latencia P95

—

Errores

0 / 6 ejecuciones

Última revisión por Equipo Tokonomix·24 de mayo de 2026