Ir al contenido
Se ejecuta en:USCreado en:United States
OpenAI

gpt-3.5-turbo-1106

Equipo editorial Tokonomix·Revisado por Mes Kalkan··

GPT-3.5 Turbo 1106 es un modelo de lenguaje grande desarrollado por OpenAI, lanzado en noviembre de 2023 como parte de la familia GPT-3.5. Este modelo representa una mejora iterativa sobre versiones anteriores de GPT-3.5, incorporando capacidades mejoradas de seguimiento de instrucciones y un rendimiento superior en diversas tareas de procesamiento de lenguaje natural. Utiliza una arquitectura basada en transformadores entrenada con datos de texto diversos de internet, aunque OpenAI no ha revelado públicamente el recuento exacto de parámetros ni las especificaciones detalladas de entrenamiento. El modelo está diseñado para aplicaciones de generación de texto de propósito general, incluyendo IA conversacional, creación de contenido, resumen, traducción y tareas de respuesta a preguntas. Procesa entradas de texto y genera respuestas similares a las humanas basándose en los patrones aprendidos durante el entrenamiento. GPT-3.5 Turbo 1106 admite interacciones estándar basadas en texto y puede manejar instrucciones complejas mientras mantiene el contexto a lo largo de conversaciones de múltiples turnos. El modelo demuestra competencia en múltiples dominios e idiomas, aunque el rendimiento puede variar dependiendo de la tarea específica y el idioma. Dentro de la línea de modelos de OpenAI, GPT-3.5 Turbo 1106 se sitúa por debajo de la serie más avanzada GPT-4 en términos de capacidades y rendimiento de razonamiento. Sirve como una opción competente para aplicaciones donde no se requiere la sofisticación adicional de los modelos GPT-4. El modelo es accesible a través de la API de OpenAI y ha sido integrado en diversas aplicaciones y servicios. Esta versión reemplazó iteraciones anteriores de GPT-3.5 Turbo, ofreciendo mayor confiabilidad y funciones de llamada a funciones mejoradas para desarrolladores que construyen aplicaciones impulsadas por IA.

GPT-3.5 Turbo 1106 representa el equilibrio entre capacidad y accesibilidad en la familia GPT-3.5, ofreciendo mejoras significativas en seguimiento de instrucciones respecto a versiones anteriores.

Análisis comparativo Tokonomix
Sección 01

Puntuaciones de calidad

Resultados de evaluación de modelos juez en diversas categorías de tareas. Las puntuaciones reflejan coherencia, precisión y seguimiento de instrucciones.

100
Generación de código
98
Multilingüe
100
Razonamiento
Sección 02

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰
Tarifas API — gpt-3.5-turbo-1106
$1.00 por 1M de tokens de entrada
$2.00 por 1M de tokens de salida
≈ $0.0010 por conversación típica (800 tokens)
Precio entrada vs salida (por 1M de tokens)
por 1M de tokens de entrada$1.00
por 1M de tokens de salida$2.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.00

input / 1M

— stable

$2.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Sección 03

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Seguimiento mejorado de instrucciones complejasConversaciones multi-turno coherentesSoporte robusto multilingüeTiempos de respuesta rápidosIntegración directa via API OpenAIGeneración versátil de contenidoActualizaciones iterativas documentadasAmplia adopción y ejemplos comunitarios

Debilidades

Razonamiento inferior a GPT-4Fecha de corte de conocimiento limitadaSin acceso a herramientas externasEspecificaciones técnicas no divulgadas públicamente
Sección 04

Capacidades

toolssource: litellmparallel toolsprompt cachingmax output tokens: 4096
Sección 05

Preguntas frecuentes

GPT-3.5 Turbo 1106 es adecuado para tareas conversacionales generales, generación de contenido y casos donde la velocidad de respuesta es prioritaria. Si tu aplicación requiere razonamiento complejo, análisis profundo o tareas matemáticas avanzadas, GPT-4 ofrece capacidades superiores.

Para equipos que buscan un modelo conversacional confiable sin necesitar las capacidades de razonamiento más avanzadas, esta versión ofrece un punto de entrada sólido dentro del ecosistema OpenAI.

Evaluación técnica Tokonomix
Sección 06

Disponibilidad

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 07

Veredictos del benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-581/100 · 76 runs
46 correct18 partial12 wrong61% accuracy
2026-06-14

New tool capabilities added; performance data still unavailable

The gpt-3.5-turbo-1106 model has received significant functional updates in this benchmark window, adding support for tools, parallel tool execution, and prompt caching capabilities. These additions expand the model's utility for developers building applications that require function calling and iterative workflows. However, the absence of performance data in both the current and previous benchmark windows makes it impossible to assess the model's actual execution quality, latency, or reliability characteristics. Without metrics on accuracy, response times, or comparative performance against other models in its class, users lack critical information needed for informed deployment decisions. The new capabilities represent important feature parity improvements, particularly the parallel tools functionality which can reduce latency in complex multi-step operations. Prompt caching may offer efficiency gains for applications with repetitive context. Despite these functional enhancements, the continued lack of benchmark results means the model's practical performance remains unverified through independent testing. Organizations considering this model should conduct their own evaluation testing to validate it meets their specific requirements for accuracy, speed, and cost effectiveness.

Quality

Latency p50

Test runs

0

Tool support added Parallel tools capability enabled Prompt caching now available No performance data available
Sección 08

Perfil completo del modelo

gpt-3.5-turbo-1106 — illustration 1

⚠️ Modelo obsoleto. OpenAI ha retirado este modelo. Para nuevos proyectos, consulte GPT-4o mini para uso general rentable o GPT-4.1 para un razonamiento más sólido. Las integraciones existentes deben planificar la migración antes de que el endpoint de la API sea discontinuado.

gpt-3.5-turbo-1106: la instantánea que introdujo el modo JSON

gpt-3.5-turbo-1106 es la instantánea con fecha de GPT-3.5 Turbo lanzada el 6 de noviembre de 2023. Fue el lanzamiento de OpenAI DevDay: el modelo que trajo el modo JSON, las llamadas a funciones paralelas y los parámetros de semilla para la reproducibilidad a la línea 3.5.

El modelo está obsoleto ahora. El identificador anclado sigue resolviendo pero las nuevas construcciones deberían apuntar a un modelo actual.

Qué se lanzó en esta versión

El lanzamiento del 6 de noviembre de 2023 fue menos sobre mejoras en los pesos del modelo y más sobre características de la superficie de la API. La línea 3.5 estaba alcanzando un tipo de madurez; OpenAI usó este lanzamiento para añadir los controles de tiempo de despliegue que los equipos de producción habían estado pidiendo.

Modo JSON. Antes de 1106, obtener JSON fiable de 3.5 Turbo significaba ingeniería de prompts y un parser defensivo. La versión 1106 añadió un indicador que restringía la generación a JSON válido. La restricción no era el cumplimiento estricto del esquema —eso llegó después— pero era suficiente para hacer fiables las salidas con forma de JSON sin trucos en la capa de prompts. Para los pipelines de extracción de datos que habían estado trabajando alrededor del comportamiento anterior, esto fue una simplificación real.

Llamadas a funciones paralelas. El soporte de llamadas a funciones anterior en 3.5 era secuencial: el modelo podía solicitar una llamada a herramienta a la vez, y había que volver al modelo para la siguiente. La versión 1106 añadió la capacidad de que el modelo solicitara múltiples llamadas a herramientas en una sola respuesta. Los bucles de agentes que antes necesitaban N ida y vueltas para N llamadas a herramientas podían colapsar en una.

Reproducibilidad. El parámetro seed llegó en esta versión. Pase la misma semilla y el mismo prompt, obtenga la misma salida la mayoría de las veces. La parte "la mayoría de las veces" es importante: el parámetro mejoró la reproducibilidad sin garantizarla, porque el no-determinismo del stack de inferencia seguía filtrándose. Pero para el trabajo de evaluación y depuración, la semilla era suficientemente útil como para que la mayoría de los equipos de producción comenzaran a usarla.

Qué permaneció igual

El comportamiento del modelo subyacente. 1106 era la generación 3.5 bajo el capó. Profundidad de razonamiento, factualidad, calibración de rechazos: todo prácticamente igual que las instantáneas inmediatamente anteriores. La versión fue sobre la ergonomía del despliegue, no sobre hacer el modelo más inteligente.

Ventana de contexto. 16 385 tokens. Suficientemente larga para la mayoría del tráfico de chat, suficientemente corta para que las cargas de trabajo de documentos largos toparan con el límite regularmente.

Perfil de coste. Los precios de la familia 3.5 siguieron anclando el extremo barato de la línea OpenAI.

Por qué los equipos anclaron a 1106

Para las cargas de trabajo que dependían de las características de la API que introdujo esta instantánea, 1106 era el anclaje correcto durante finales de 2023 y hasta 2024.

Pipelines dependientes del modo JSON. Cualquier equipo que construyó alrededor del nuevo modo JSON en noviembre de 2023 quería reproducibilidad frente a la instantánea específica que lo introdujo. El comportamiento era ligeramente diferente de las versiones posteriores, y los parsers posteriores ajustados a 1106 podían regresar cuando se actualizaban.

Bucles de agentes con múltiples herramientas. Los frameworks de agentes tempranos que aprovecharon las llamadas a funciones paralelas anclaron a 1106 porque el comportamiento específico del patrón de llamadas —cuándo el modelo agrupaba las llamadas, cómo las ordenaba, qué argumentos producía— era sensible a la instantánea.

Evaluaciones dependientes de la reproducibilidad. Los flujos de trabajo de investigación y CI que comenzaron a usar el parámetro de semilla en noviembre de 2023 a menudo anclaron a 1106 porque el comportamiento del parámetro era suficientemente nuevo como para que el equipo no quisiera también variar la instantánea del modelo en el mismo experimento.

La instantánea 0125, lanzada dos meses y medio después, era una versión más pulida del mismo conjunto de características. La mayoría del tráfico de producción que comenzó en 1106 acabó moviéndose a 0125 dentro de un trimestre.

Objetivos de migración

Para las cargas de trabajo dependientes del modo JSON, la característica de salidas estructuradas estrictas que llegó en la instantánea GPT-4o de agosto de 2024 y en toda la familia GPT-4.1 es el mejor objetivo que otra instantánea 3.5. El cumplimiento del esquema en la capa de inferencia es notablemente más fiable que el modo JSON con parsing defensivo.

Para las cargas de trabajo de bucles de agentes construidas sobre llamadas a funciones paralelas, el mismo patrón de llamadas funciona en GPT-4o, GPT-4.1 y la variante mini 4.1. La diferencia de comportamiento es suficientemente pequeña como para que la migración sea normalmente un cambio de etiqueta más una re-evaluación.

Para los flujos de trabajo de evaluación dependientes de la reproducibilidad, el parámetro de semilla es soportado en toda la línea OpenAI actual. Moverse de 1106 a un modelo actual significa establecer de nuevo la referencia de las salidas de evaluación seeded frente al nuevo modelo; el parámetro en sí no cambia.

Qué hacer hoy

Si 1106 sigue anclado en su stack, los elementos de acción reflejan el resto de la familia 3.5. Audite la carga de trabajo para confirmar que el anclaje sigue justificándose. Ejecute una evaluación medida frente al candidato de migración. Planifique la transición para una ventana de lanzamiento de su elección en lugar de bajo la presión de la obsolescencia.

El caso específico de 1106 a vigilar es el código posterior que depende del comportamiento temprano de llamadas a funciones paralelas. Algunos frameworks de agentes que crecieron frente a esta instantánea tienen casos extremos en cómo analizan las respuestas de múltiples herramientas que son técnicamente válidas frente a modelos posteriores pero comportamentalmente diferentes. Vuelva a probar los bucles, no solo el modelo.

Para la comparación entre categorías, consulte /benchmarks/leaderboard. Para el contexto del identificador flotante 3.5, consulte GPT-3.5 Turbo.

Cuándo elegirlo

No elija esta instantánea para nuevas construcciones. La familia 3.5 está obsoleta.

Para las integraciones 1106 existentes, los sucesores naturales son GPT-4o mini para el tráfico de chat general y GPT-4.1 mini o GPT-4.1 completo para cargas de trabajo donde el techo de razonamiento de la generación 3.5 ya era una restricción. Planifique la migración antes de que llegue la fecha de obsolescencia.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

gpt-3.5-turbo-1106 — illustration 2gpt-3.5-turbo-1106 — illustration 3
Última prueba automática
14 jun 2026 · 04:56 UTC · Benchmark
Latencia P50
1328 ms
Latencia P95
Errores
0 / 6 ejecuciones
Última revisión por Equipo Tokonomix·24 de mayo de 2026