
Esta es la instantánea fechada del modelo base original GPT-5, lanzado el 7 de agosto de 2025 y congelado en ese punto. Mientras que el slug flotante gpt-5 ha seguido moviéndose bajo los equipos que lo señalaban, esta versión fechada captura un conjunto específico de pesos, un perfil de comportamiento específico, un artefacto reproducible. Esto la hace útil para un conjunto reducido pero importante de trabajos: líneas base de comparación, flujos de trabajo regulados, y cualquier producto que necesite señalar al mismo modelo dentro de seis meses y obtener la misma respuesta.
Por qué existen las instantáneas fechadas
OpenAI distribuye cada generación en dos variantes. El nombre flotante (gpt-5) sigue cualquier instantánea que sea actualmente recomendada. El nombre fechado (gpt-5-2025-08-07) fija una versión específica de los pesos. El slug flotante se beneficia de mejoras silenciosas; el slug fechado se beneficia de no sorprenderte nunca.
Para comparaciones de evaluación a lo largo del tiempo, el slug fechado es la única elección honesta. Si tu informe de benchmark de diciembre dice "GPT-5 obtuvo X en nuestra suite", y alguien lo vuelve a ejecutar en mayo contra el slug flotante, no estarán comparando el mismo modelo. La instantánea fechada soluciona eso. El comportamiento del 7 de agosto de 2025 es el comportamiento que obtienes cada vez que lees este endpoint, hasta que OpenAI eventualmente lo retire.
Qué es esta instantánea
GPT-5 fue el primer modelo de la familia GPT-5, lanzado como un modelo frontera multimodal de texto y visión. La instantánea 2025-08-07 refleja el comportamiento de lanzamiento: datos de entrenamiento hasta cualquier fecha límite que OpenAI usó a mediados de 2025, el pase original de entrenamiento de seguridad, la calibración original del codificador de visión, los comportamientos originales de uso de herramientas.
Actualizaciones posteriores del slug flotante han modificado estas características. Los cambios documentados a lo largo de la línea 5.x más amplia han incluido un seguimiento de instrucciones refinado en casos límite, comportamiento de rechazo ajustado en ciertas categorías de contenido, y mejoras incrementales al OCR de visión. Ninguno de esos cambios toca esta instantánea. Lo que obtuviste en agosto de 2025 es lo que obtienes hoy.
Bajo el capó
El modelo es un decodificador transformer que acepta entradas de texto e imagen intercaladas y emite salida únicamente de texto. El recuento de parámetros, los detalles de enrutamiento de expertos, y las elecciones arquitectónicas exactas no son públicas. La tokenización usa el vocabulario BPE de GPT-5. Las entradas de imagen se codifican en mosaicos a un coste fijo de tokens por mosaico, que se acumula rápidamente en cargas de trabajo de documentos de múltiples páginas.
El límite de entrenamiento para esta instantánea se sitúa a mediados de 2025. El modelo conoce estándares de lenguaje principales y versiones de frameworks vigentes en ese período y fabricará alegremente información sobre cualquier cosa más reciente. Para flujos de trabajo que involucran eventos recientes o nuevas APIs de bibliotecas, esto importa — fija la instantánea, acepta que el conocimiento envejece, y enruta consultas de eventos actuales a través de recuperación o búsqueda web en lugar de depender del conocimiento paramétrico del modelo.
Dónde se posiciona hoy
Frente al panorama más amplio de modelos frontera, la instantánea de agosto de 2025 de GPT-5 se sitúa en el nivel superior en tareas de propósito general y el nivel medio-superior en trabajo intensivo de visión. Las versiones más nuevas 5.1, 5.2 y posteriores instantáneas la han superado en la mayoría de métricas. La tabla de clasificación de inteligencia rastrea la clasificación comparativa.
Para una instantánea fijada en agosto de 2025 este es el patrón esperado. El punto no es ser el modelo absolutamente mejor disponible en mayo de 2026; el punto es ser el mismo modelo en mayo de 2026 que en agosto de 2025, para que las comparaciones y auditorías permanezcan válidas.
Cuándo fijar a esta instantánea
Recurre a gpt-5-2025-08-07 cuando la reproducibilidad sea más valiosa que la calidad máxima. Los casos de uso claros:
Comparaciones de evaluación a lo largo del tiempo. Si tu suite de benchmark se ejecutó contra esta instantánea cuando se lanzó, ejecútala contra esta instantánea nuevamente en lugar del slug flotante. De lo contrario estás midiendo la evolución del modelo en lugar de tu propio cambio.
Decisiones reguladas donde los registros de auditoría necesitan identificar el modelo exacto que produjo una salida dada. "Usamos gpt-5" es una respuesta insuficiente cuando un auditor pregunta qué versión. "Usamos gpt-5-2025-08-07" es suficiente.
Funcionalidades de cara al cliente con SLAs de calidad que fueron calibrados contra un comportamiento de modelo específico. Si tus prompts y ejemplos few-shot fueron ajustados a esta instantánea, moverte a una más nueva sin re-ajustar arriesga regresiones sutiles.
Experimentos A/B de larga duración donde el control necesita permanecer genuinamente fijo durante la duración de la prueba.
Cuándo no fijar a esta instantánea
Evítala para el desarrollo de nuevas funcionalidades. Usa el slug flotante o la instantánea fechada más reciente en su lugar; quieres el modelo más capaz disponible mientras construyes, no el más antiguo disponible que todavía funciona.
Evítala para chat de propósito general y flujos de trabajo de contenido donde las ganancias en instantáneas más nuevas son reales y el coste de la deriva de comportamiento es bajo. Las instantáneas 5.1, 5.2 y posteriores son mejores en las mismas cargas de trabajo. Fija al historial solo cuando el historial importa.
Evítala si estás ejecutando cualquier prompt que dependa del conocimiento de eventos posteriores a mediados de 2025. El modelo no lo sabe. Adivinará. Las adivinanzas a veces sonarán correctas y a veces serán completamente erróneas.
Notas operacionales
OpenAI publica cronogramas de desaprobación para instantáneas fechadas. Las instantáneas más antiguas eventualmente se retiran. Cuando eso le suceda a esta, tu código que fija este slug comenzará a devolver errores. Planifica con anticipación: suscríbete a los anuncios de desaprobación, y mantén un camino hacia adelante a cualquier instantánea que fijarás a continuación.
Para flujos de trabajo de extracción de datos donde la capacidad de visión es crítica, la instantánea de agosto de 2025 es competente pero ha sido superada por refinamientos posteriores del codificador de visión. Si el trabajo lo permite, ejecuta los mismos documentos a través de esta instantánea y una más nueva en paralelo durante algunas semanas antes de decidir si migrar la fijación.
Alternativas
Para flujos de trabajo que necesitan el mismo tipo de reproducibilidad fijada pero se preocupan por un modelo diferente, cada proveedor frontera ahora distribuye instantáneas fechadas junto a sus slugs flotantes. El patrón es estándar de la industria. Elige el modelo que coincida con tus requisitos de calidad y modalidad, luego fija su versión fechada en lugar de la flotante.
Para optimización pura de coste en cargas de trabajo rutinarias, los miembros más pequeños de la familia 5.x (los niveles mini y nano) cubren la mayor parte de lo que el chat de propósito general realmente necesita a una fracción del coste. Fija esas instantáneas también si te preocupa la reproducibilidad allí.
Última revisión técnica: 2026-05-22 — Tokonomix.ai

