
gpt-3.5-turbo-0125: la actualización de enero de 2024⚠️ Modelo obsoleto. OpenAI ha retirado este modelo. Para nuevos proyectos, consulte GPT-4o mini para uso general rentable o GPT-4.1 para un razonamiento más sólido. Las integraciones existentes deben planificar la migración antes de que el endpoint de la API sea discontinuado.
gpt-3.5-turbo-0125 es la instantánea con fecha de GPT-3.5 Turbo lanzada el 25 de enero de 2024. Fue la última actualización significativa de capacidad de la línea 3.5: seguimiento de instrucciones más agudo, correcciones de problemas en el modo JSON y las mejoras del tokenizador que hicieron que el modelo se comportara de manera más predecible en casos extremos.
Ahora está retirado. El identificador anclado sigue resolviendo hoy pero el horizonte de obsolescencia es finito, y los nuevos proyectos no deberían apuntarlo.
Qué cambió en esta versión
El titular de las notas de OpenAI de enero de 2024 fue el seguimiento de instrucciones. Las instantáneas 3.5 anteriores tenían la costumbre de parafrasear las instrucciones en lugar de ejecutarlas: el modelo reconocía una solicitud y luego se desviaba hacia una respuesta diferente de la que el prompt pedía realmente. La versión 0125 apretó eso de forma material.
Para los equipos que ejecutaban 3.5 en producción, la mejora en el seguimiento de instrucciones fue el tipo de actualización que no aparece en las puntuaciones de benchmark pero sí aparece en las puntuaciones de evaluación frente a los propios prompts. La misma definición de tarea producía una salida más limpia, y las soluciones en la capa de prompts escritas contra instantáneas anteriores a menudo podían retirarse.
El modo JSON fue la otra corrección silenciosa. Las instantáneas 3.5 anteriores producían JSON que era mayormente válido pero ocasionalmente malformado en casos extremos específicos: comas finales en arrays, llaves de cierre faltantes bajo carga, escapado inconsistente de cadenas anidadas. La versión 0125 corrigió suficientes de esos para que los parsers posteriores pudieran eliminar una o dos capas de manejo defensivo.
El perfil de coste se mantuvo donde vivía el resto de la línea 3.5, lo cual era lo que hacía interesantes estas mejoras en ese momento. Mismo precio, mejor comportamiento.
Qué seguía roto
Profundidad de razonamiento. 0125 seguía siendo un modelo de clase 3.5. Los prompts de múltiples pasos que requerían un encadenamiento real de inferencias, la síntesis de código novedoso, los puzles de lógica densa: todo visiblemente más débil que lo que GPT-4 ya había lanzado. La corrección del seguimiento de instrucciones hizo al modelo más fiable; no lo hizo más inteligente en ningún sentido profundo.
Factualidad. Las alucinaciones no se abordaron de ninguna forma estructural. El modelo seguía inventando respuestas confiadas cuando el prompt no contenía la respuesta. La generación aumentada por recuperación o la revisión humana seguía siendo necesaria en cualquier ruta factual.
Calibración de rechazos. Ligeramente más consistente que las instantáneas anteriores, pero el patrón de rechazar prompts inocuos y cumplir con los de borde que los modelos frontier rechazarían persistió.
Por qué los equipos anclaron a 0125
Durante la mayor parte de 2024, cuando 3.5 era el valor predeterminado rentable, esta era la instantánea a la que los equipos anclaban. Tres razones.
Primera, "el 3.5 estable más reciente". Los despliegues de producción que necesitaban reproducibilidad querían el modelo con los menos quirks conocidos; 0125 era la opción más reciente y menos defectuosa.
Segunda, los pipelines posteriores ajustados contra el comportamiento de 0125. Una vez que un parser, una suite de pruebas de CI o un clasificador posterior ajustado a medida se habían construido contra esta instantánea, el coste de reajustar contra una instantánea más reciente era real. El anclaje protegía esa inversión.
Tercera, los flujos de trabajo regulados aprobados contra este identificador. Algunas revisiones de cumplimiento se completaron específicamente contra 0125 y no podían moverse a una instantánea diferente sin un nuevo ciclo de auditoría.
Las tres razones han envejecido mal ahora que la familia 3.5 está obsoleta. El objetivo de migración ya no es una instantánea 3.5 diferente.
Migración hoy
La instantánea 0125 es más reciente que la versión original de 3.5 y el cálculo de migración es ligeramente diferente al de migrar desde el Turbo original.
Si ancló a 0125 específicamente por las mejoras en el seguimiento de instrucciones, la migración de comportamiento más cercana es GPT-4o mini. La latencia es comparable, la superficie de la API es la misma, el seguimiento de instrucciones es notablemente más sólido.
Si su pipeline posterior depende del comportamiento específico del modo JSON de 0125, la característica de salidas estructuradas en las instantáneas GPT-4o desde agosto de 2024 en adelante y en toda la familia GPT-4.1 es un reemplazo más fiable. Es posible que necesite reajustar el parser posterior; el panorama más amplio es que el cumplimiento estricto del esquema elimina los modos de fallo contra los que los trucos de ingeniería de prompts estaban trabajando.
Si su carga de trabajo con forma de razonamiento ya estaba empujando a 0125 más allá de su techo, el salto a gpt-4.1-mini o al GPT-4.1 completo es el salto más grande pero es el que se ajusta a la carga de trabajo.
Qué hacer hoy
Si 0125 sigue en su stack:
Primero, audite la carga de trabajo. La familia 3.5 era suficientemente buena para una gran fracción del tráfico de producción de 2024; la pregunta es si su carga de trabajo específica sigue beneficiándose de este anclaje o si debería haberse movido hace un año.
Segundo, ejecute una evaluación real contra su candidato de migración. Los modelos más recientes a menudo necesitan prompts diferentes, y mantener la ingeniería de prompts de la era 0125 puede hacer que un sucesor parezca peor de lo que es.
Tercero, planifique la transición antes de que llegue el correo de obsolescencia. La familia 3.5 está en un calendario finito. El tráfico de producción en una instantánea 3.5 anclada es un riesgo conocido; un riesgo conocido es uno que puede mitigar en su propio calendario.
Para la comparación entre categorías, consulte /benchmarks/leaderboard.
Cuándo elegirlo
No elija esta instantánea para nuevas construcciones. La familia 3.5 está obsoleta y los identificadores anclados eventualmente serán discontinuados.
Para las integraciones existentes, planifique la migración. El sucesor de comportamiento más similar para las cargas de trabajo con forma de 0125 es GPT-4o mini; el movimiento prospectivo es la familia GPT-4.1. En cualquier caso, la transición debería ocurrir en su calendario de lanzamiento, no en el calendario de obsolescencia de OpenAI.
Última revisión técnica: 2026-05-22 — Tokonomix.ai

