
Claude Opus 4.7 es el último modelo de la cima de la pila de Anthropic. Ofrece una ventana de contexto de un millón de tokens y la misma superficie de entrada de texto e imagen que la línea Opus ha mantenido desde la versión 4.x. Los precios no están publicados en esta página. Las capacidades, sí.
Si ha trabajado con Opus 4.5 o 4.6, la actualización a 4.7 le resultará familiar antes de que se sienta diferente. Mismo estilo de rechazo, mismo gusto por mostrar el proceso, misma preferencia por respuestas cautelosas cuando el prompt es ambiguo. Lo que cambió está principalmente por debajo: mejor recuperación de información en el extremo largo de la ventana de contexto, formato más ajustado en las llamadas de herramientas y un ritmo ligeramente diferente en la escritura de formato largo que algunos revisores describen como menos hesitante.
Qué aporta realmente el contexto de 1M
Un millón de tokens es suficiente para un expediente de resultados trimestrales completo, un monorepo de tamaño mediano, o los últimos dieciocho meses de Slack de un equipo. Esa es la línea de marketing. La pregunta práctica es si el modelo sigue prestando atención al inicio del buffer una vez que el final está lleno.
En nuestras propias pruebas de recuperación, Opus 4.7 se mantiene bien pasadas las 200k tokens, que es donde la generación anterior comenzaba a olvidar hechos colocados al principio. Más allá de aproximadamente 600k tokens se aprecia cómo la latencia se estira: el tiempo hasta el primer token aumenta notablemente, y los tokens por segundo en streaming caen. Los números detallados varían en cada ciclo; la imagen actualizada está en /benchmarks/speed y /benchmarks/intelligence.
Dos implicaciones prácticas. Primera: la ventana larga es genuinamente utilizable para tareas como la diligencia debida entre documentos y la revisión de código de repositorios completos, no solo un número en la hoja de especificaciones. Segunda: conviene seguir pensando en el caché de prompts para consultas repetidas contra el mismo corpus grande. Recargar 800k tokens de contexto en cada llamada es costoso en tiempo de reloj aunque la llamada a la API misma se complete sin problemas.
Entrada de visión, con advertencias
Opus 4.7 acepta imágenes junto al texto. Es bueno en lo que la línea Opus siempre ha sido buena: leer capturas de pantalla de paneles de control, extraer tablas de PDFs renderizados como imágenes de página, describir diagramas. Es menos impresionante con gráficos densos donde las etiquetas de los ejes son pequeñas, y sigue leyendo mal cifras manuscritas con suficiente frecuencia como para no ponerlo en un bucle sin un humano en el medio.
Para cargas de trabajo de OCR intensivo donde principalmente se quiere texto a partir de imágenes, un modelo más pequeño con capacidad de visión de la familia Claude o Gemini suele hacer el trabajo a una fracción del coste. Reserve Opus 4.7 para los casos en que también necesite que el modelo razone sobre lo que está viendo.
Su posición frente al campo
Opus 4.7 compite con GPT-5, GPT-5.1 y Gemini 3 Pro Preview en la cima de la pila. Elegir entre ellos rara vez es una victoria clara en un único eje.
Algunos patrones se mantienen consistentemente en nuestras pruebas. Opus 4.7 es el más propenso de los tres a rechazar directamente un prompt límite, lo cual es lo que algunos equipos quieren y otros encuentran frustrante. Tiende a sobreexplicar cuando una respuesta de una línea bastaría. En tareas de salida estructurada con un esquema JSON, sigue el esquema de forma fiable sin el campo extra alucinado ocasional que versiones anteriores de Claude introducían. El rendimiento multilingüe —en particular en prosa administrativa alemana, francesa y polaca— ha sido un punto fuerte silencioso de la línea Opus y 4.7 no regresa en eso.
GPT-5.1 sigue sintiéndose más rápido en turnos conversacionales cortos. Gemini 3 Pro Preview está más cerca de la paridad que la generación anterior, pero su patrón de atención en contexto largo es diferente: a veces rinde mejor en un único dato enterrado y peor en la síntesis a través de muchos datos dispersos.
Para una vista de comparación entre categorías, el /benchmarks/leaderboard actualizado es el lugar indicado. La metodología de puntuación y las elecciones de conjuntos de datos están documentadas en /benchmarks/methodology.
Cuándo no es la herramienta adecuada
Generación de código en frameworks de rápida evolución. Opus 4.7 es competente pero conservador; escribe código seguro y verboso donde los competidores de tipo codex escriben código idiomático. Si está autocompletando en un IDE en lugar de producir salida auditada, la diferencia importa. Use una de las encuestas de modelos en /usecases/code para comparar directamente.
Voz y audio en tiempo real. Opus 4.7 no tiene entrada de audio. Combínelo con un modelo de transcripción por delante si necesita voz como entrada, o elija un modelo de la familia audio para el inicio del pipeline. Vea /usecases/voice para ese árbol de decisión.
Clasificación de alto volumen a bajo coste. Enviar millones de prompts cortos a través de un modelo frontier es el gasto con la forma equivocada. Claude Haiku 4.5, Gemini 2.5 Flash o uno de los modelos más pequeños Llama o Mistral alojados en OVH harán esto por una pequeña fracción del presupuesto sin una caída de calidad significativa en tareas simples.
Cualquier cosa que requiera fine-tuning. Anthropic no ofrece fine-tuning supervisado en el tier Opus. Si su flujo de trabajo necesita pesos personalizados —vocabulario de dominio, tono de marca integrado en el modelo— está mirando hacia alternativas de peso abierto, no hacia Opus.
Notas de despliegue
La API es directa. REST, streaming soportado, los prompts de sistema se comportan como se esperaría. Las llamadas de uso de herramientas devuelven resultados limpios y la aplicación del esquema es suficientemente sólida para construir agentes sin necesidad de una capa de parsing defensivo.
La disponibilidad regional es lo que perjudica a los equipos de adquisición europeos. La inferencia de Anthropic corre en infraestructura de Google Cloud y AWS, y la API pública no expone un parámetro de selección de región. Los contratos enterprise pueden negociar cláusulas de residencia, pero la API estándar no le da una ruta de inferencia exclusivamente de la UE garantizada. Para equipos con restricciones de residencia estrictas, un Llama 3.3 70B o una instancia Mistral Small alojada en OVH es una conversación completamente diferente; vea /usecases/local.
Los logs se conservan treinta días por defecto para monitoreo de abusos. Las entradas a la API no se usan para entrenamiento salvo que se acepte explícitamente. La retención cero está disponible pero requiere negociación contractual, no un interruptor de configuración.
Cuándo elegirlo
Use Claude Opus 4.7 cuando necesite un modelo que:
- Razone cuidadosamente a través de entradas muy largas sin perder el hilo.
- Produzca salida estructurada de forma fiable.
- Gestione texto administrativo y legal en lenguas europeas sin anglificar la terminología.
- Por defecto responda "No estoy seguro" en lugar de inventar con confianza cuando el prompt no contiene la respuesta.
No lo use cuando necesite latencia en tiempo real, coste inferior a un centavo por llamada, entrada de audio nativa o pesos auto-alojados que pueda ejecutar dentro de su propio perímetro.
El resumen honesto: 4.7 es un refinamiento de un modelo ya sólido, no un cambio de escala. Si ya usa Opus 4.5 o 4.6 en producción, la migración merece la pena por las mejoras de contexto largo. Si elige un modelo frontier desde cero, pruébelo frente a GPT-5.1 y Gemini 3 Pro Preview con sus propios prompts: la elección correcta depende más de lo que le pide al modelo que de cualquier número de benchmark.
Pruebe la comparación usted mismo en /live-test. Mismo prompt, tres modelos, uno junto al otro. Sin registro.
Última revisión técnica: 2026-05-22 — Tokonomix.ai

