¿Qué ventaja real aporta el contexto de 1M de tokens?

Permite mantener conversaciones muy largas, analizar repositorios completos o procesar colecciones de documentos sin recurrir a fragmentación agresiva. Es especialmente útil en agentes que acumulan estado durante muchas iteraciones.

¿En qué se diferencia de Gemini 3.1 Pro estándar?

Esta variante incorpora capacidades extendidas de tool-calling personalizado, pensadas para integraciones más profundas con APIs, bases de datos y servicios externos. El núcleo de razonamiento se mantiene, pero la interfaz de herramientas es más flexible.

¿Soporta entradas multimodales como imágenes o audio?

Las capacidades exactas no están confirmadas en esta preview. Si tu caso depende de visión o audio, conviene validarlo directamente contra la documentación oficial antes de comprometer arquitectura.

¿Qué tipo de proyectos se benefician más de esta variante?

Sistemas de agentes, automatización de flujos de trabajo y asistentes que orquestan múltiples APIs internas. También aplicaciones que necesitan razonar sobre grandes volúmenes de texto manteniendo coherencia a lo largo de muchas etapas.

Tier C — Especialista

Se ejecuta en:USCreado en:United States

Google Gemini

Gemini 3.1 Pro Preview Custom Tools

Tier C — Especialista · 1.048576M tokens

Equipo editorial Tokonomix·Revisado por Mes Kalkan·Publicado 22 de mayo de 2026·Última revisión 24 de mayo de 2026

Gemini 3.1 Pro Preview Custom Tools es una versión experimental del modelo Gemini 3.1 Pro de Google que incorpora capacidades ampliadas de uso de herramientas. Esta variante está diseñada para desarrolladores e investigadores que exploran la invocación avanzada de funciones y la integración de herramientas externas en aplicaciones de modelos de lenguaje de gran tamaño. Permite que el modelo interactúe con APIs personalizadas, bases de datos y servicios externos mediante una interfaz estructurada de llamada a herramientas, lo que lo hace adecuado para construir agentes de IA complejos y sistemas de automatización de flujos de trabajo. El modelo cuenta con una ventana de contexto de aproximadamente 1.048 millones de tokens, lo que le permite procesar y mantener conversaciones, documentos o cadenas de razonamiento de varios pasos extremadamente largos. Esta capacidad extendida de contexto resulta especialmente útil para aplicaciones que requieren el análisis de bases de código extensas, la revisión exhaustiva de documentos o sesiones de diálogo prolongadas. El modelo ofrece capacidades estándar de generación de texto junto con su funcionalidad mejorada de uso de herramientas, dando soporte tanto a aplicaciones de IA conversacional como a implementaciones orientadas a tareas que requieren acceso a datos externos o la ejecución de acciones. Dentro del catálogo de modelos de Google, esta variante se posiciona como una versión preliminar especializada del nivel Gemini 3.1 Pro, ubicada entre los modelos estándar de producción y los lanzamientos experimentales de vanguardia. Ofrece a los desarrolladores acceso anticipado a la arquitectura de uso de herramientas en evolución de Google, manteniendo a la vez las capacidades fundamentales de razonamiento y generación de la base Gemini 3.1 Pro. La designación "Preview" indica que se trata de una versión previa al lanzamiento, destinada a pruebas y retroalimentación, no a su despliegue en producción.

Gemini 3.1 Pro Preview Custom Tools es una variante experimental orientada a quienes necesitan llevar la integración de herramientas externas más allá de lo convencional. Su ventana de contexto de más de un millón de tokens lo posiciona como una opción seria para agentes complejos y flujos de trabajo extensos.
— Resumen editorial de Tokonomix

Sección 01

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰

Tarifas API — Gemini 3.1 Pro Preview Custom Tools

$2.00 por 1M de tokens de entrada

$12.00 por 1M de tokens de salida

≈ $0.0036 por conversación típica (800 tokens)

Precio entrada vs salida (por 1M de tokens)

por 1M de tokens de entrada$2.00

por 1M de tokens de salida$12.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.00

input / 1M

— stable

$12.00

output / 1M

— stable

2026-05-242026-06-212026-07-19

Input

Output

Price change

⟳ synced weekly

Sección 02

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Contexto de 1M+ tokensTool-calling extendido y personalizadoApto para agentes complejosIntegración con APIs externasRazonamiento multi-paso prolongadoAnálisis de documentos extensosComprensión de bases de código grandesAcceso temprano a arquitectura de tools

Debilidades

Naturaleza experimental, sin garantía de estabilidadClasificación de Tier C limita producción críticaCapacidades multimodales no confirmadasDisponibilidad regional incierta en preview

Sección 03

Capacidades

toolssource: litellmvisionjson modepdf inputreasoningaudio inputjson schemaprompt cachingoutputTokenLimit: 65536max output tokens: 65536

Sección 04

Preguntas frecuentes

No del todo. Al ser una preview experimental con clasificación Tier C, conviene reservarlo para prototipos, pruebas internas o entornos donde se acepte cierta variabilidad en el comportamiento.

Una preview interesante para equipos que ya tienen claro qué quieren construir con tool-calling avanzado, aunque su carácter experimental obliga a tratarlo como pieza de I+D más que como motor de producción. Si tu caso de uso vive del contexto largo y la orquestación de APIs, merece una prueba seria.
— Veredicto del equipo de Tokonomix

Sección 05

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 06

Veredictos del benchmark Tokonomix

⚖️

Endorsed by 1 judge

Independent LLM judges evaluated this model on our weekly intelligence tests

claude-sonnet-4-544/100 · 91 runs

31 correct12 partial48 wrong34% accuracy

● 2026-07-19

New multimodal model with comprehensive tooling and input format support

Gemini 3.1 Pro Preview Custom Tools represents a substantial capability expansion for Google's model lineup. This release introduces eight new capabilities that were previously unavailable: tools, vision, JSON mode, PDF input, reasoning, audio input, JSON schema, and prompt caching. The model now supports a comprehensive multimodal experience, accepting text, images, audio, and PDF documents as inputs. The addition of custom tools and structured output formats through JSON mode and JSON schema makes this variant particularly suited for integration into complex workflows and applications requiring deterministic outputs. The reasoning capability suggests enhanced analytical performance, though specific benchmark comparisons are not available given this is the first window of data collection. Prompt caching support indicates optimization for repeated interactions and cost efficiency in production deployments. As a preview release, users should expect this model to undergo refinement, but the breadth of capabilities positions it as a versatile option for developers needing multimodal understanding combined with tool use and structured generation. The simultaneous addition of multiple major features represents one of the more comprehensive single-release expansions in recent model updates.

Quality

—

Latency p50

—

Test runs

✓ Eight new capabilities added✓ Full multimodal input support✓ Custom tools and JSON schema✓ Prompt caching enabled

Sección 07

Perfil completo del modelo

Gemini 3.1 Pro Preview Custom Tools: el especialista en bucles de agente

Nota — perfil prospectivo. Gemini 3.1 Pro Preview Custom Tools (gemini-3.1-pro-preview-customtools) es una instantánea de vista previa. El comportamiento, las capacidades y los límites de tasa cambiarán antes de la disponibilidad general.

Una variante especializada de la vista previa 3.1 Pro construida para cargas de trabajo que dependen en gran medida de la integración estructurada de herramientas. Una ventana de contexto de 1 048 576 tokens. Entrada de texto e imagen. La misma superficie de capacidad subyacente que la vista previa 3.1 Pro base, más un comportamiento mejorado de uso de herramientas ajustado para bucles de agentes de producción.

Si ha construido un sistema de agentes sobre un modelo Gemini de tier superior y ha tenido que escribir capas de parsing defensivo alrededor de la salida de llamadas a herramientas, esta variante está diseñada para su situación.

Qué añade realmente "Custom Tools"

La variante Custom Tools es el mismo modelo subyacente con un entrenamiento específico y un ajuste en el tiempo de inferencia para la integración de herramientas. Las diferencias respecto a la vista previa 3.1 Pro base se manifiestan en:

Payloads de llamadas a herramientas más fiables bajo esquemas complejos. La vista previa 3.1 Pro base ya es sólida aquí; la variante Custom Tools lo es aún más.
Mejor gestión de cadenas largas de resultados de herramientas donde el modelo necesita interpretar la salida de una herramienta para decidir qué herramienta llamar a continuación.
Recuperación de errores más limpia cuando una herramienta devuelve un resultado inesperado o falla por completo. El modelo tiene más probabilidades de reconocer el modo de fallo y reintentarlo con ajustes o escalarlo con limpieza.
Adherencia mejorada a las políticas de uso de herramientas: instrucciones sobre cuándo llamar a herramientas, cuándo preguntar al usuario, cuándo rechazar, cuándo diferir.
Visibilidad de razonamiento más consistente cuando el agente decide entre múltiples opciones de herramientas.

La vista previa 3.1 Pro base cubre la mayoría de las cargas de trabajo. La variante Custom Tools es para cargas de trabajo donde la mejora marginal en la fiabilidad del bucle de agente justifica suficientemente el modelo especializado.

Qué hace bien

Hereda los puntos fuertes subyacentes de la vista previa 3.1 Pro. La ventana de contexto de 1M con calidad de atención que se mantiene en profundidad. Gestión multimodal sólida. Profundidad de razonamiento de nivel superior. Entrada de visión nativa.

Sobre eso, el pulido del uso de herramientas. Los bucles de agentes de producción que antes necesitaban capas de parsing defensivo, arneses de reintento o ingeniería cuidadosa de esquemas tienden a funcionar de forma más limpia sin configuración adicional en esta variante.

El perfil de latencia es similar al de la vista previa 3.1 Pro base. El ajuste de Custom Tools no añade una sobrecarga de latencia significativa.

Qué hace mal

Aplican las consideraciones del tier de vista previa. Los límites de tasa, la disponibilidad regional y los comportamientos específicos pueden cambiar antes de la disponibilidad general.

Para cargas de trabajo que no dependen en gran medida de la integración de herramientas, la variante Custom Tools proporciona un valor marginal sobre la vista previa 3.1 Pro base. El ajuste especializado está diseñado para cargas de trabajo con uso intensivo de herramientas; para casos de uso con forma de chat o extracción, la variante base es el punto de partida correcto.

El coste por llamada en el tier Pro es significativo. Para bucles de agentes de alto volumen, el argumento de coste depende de si las mejoras de fiabilidad compensan el gasto a escala.

El despliegue auto-alojado no está disponible. Google no distribuye pesos Gemini.

Dónde brilla

Algunas cargas de trabajo donde la variante Custom Tools gana su posicionamiento especializado:

Bucles de agentes de producción que orquestan muchas llamadas a herramientas por tarea y necesitan alta fiabilidad a lo largo de la cadena.
Ecosistemas de herramientas complejos con esquemas profundamente anidados donde la adherencia al esquema bajo presión importa.
Flujos de trabajo donde las salidas de herramientas son en sí mismas complejas y el modelo necesita interpretarlas cuidadosamente para decidir qué hacer a continuación.
Sistemas de agentes con políticas estrictas de uso de herramientas —cuándo llamar a herramientas, cuándo diferir, cuándo escalar— donde la adherencia a esas políticas importa para el diseño operacional.
Casos de uso donde el coste de un fallo del bucle de agente es suficientemente alto como para justificar el modelo especializado.

Cuándo no es la herramienta adecuada

Cargas de trabajo que no usan herramientas de forma intensiva. La vista previa 3.1 Pro base es el punto de partida correcto: misma superficie del modelo, aplicabilidad más amplia.

Cargas de trabajo de producción que necesitan un comportamiento estable hoy. La base 2.5 Pro cubre el uso de herramientas de forma sólida para la mayoría de las cargas de trabajo; la variante Custom Tools en tier de vista previa aún no es la opción correcta para bucles de agentes críticos en producción.

Clasificación barata de alto volumen o trabajo con prompts cortos. La computación del tier superior es el gasto con la forma equivocada para estas cargas de trabajo independientemente de la variante.

Cualquier cosa fuera de la entrada de texto e imagen. Voz, audio, vídeo son familias de modelos diferentes.

Cómo se compara con las alternativas

Frente a la vista previa 3.1 Pro base: la variante Custom Tools es una mejora marginal en la fiabilidad del uso de herramientas para cargas de trabajo con uso intensivo de herramientas. Para trabajo sin uso intensivo de herramientas, la variante base es la opción correcta.

Frente a 2.5 Pro con prompts de uso de herramientas personalizados: para cargas de trabajo donde ya se ha invertido en ingeniería cuidadosa de prompts y parsing defensivo alrededor del comportamiento de uso de herramientas de 2.5 Pro, la aritmética de migración depende de si la variante Custom Tools permite simplificar esa arquitectura circundante de forma significativa.

Frente a Claude Opus con uso de herramientas habilitado: Opus tiene su propio comportamiento sólido de uso de herramientas con la postura de rechazo al estilo Anthropic. Para cargas de trabajo donde el razonamiento cuidadoso al estilo Opus encaja mejor, esa es la opción correcta. Para cargas de trabajo donde la salida más rápida y directa de Gemini encaja mejor, la variante Custom Tools es la opción más orientada al bucle de agente.

Frente al tier superior de OpenAI con salidas estructuradas y llamadas a funciones: ambos ecosistemas han invertido fuertemente en la fiabilidad del uso de herramientas. La elección a menudo se reduce al encaje con el ecosistema en lugar de la capacidad bruta.

El panorama por categorías está en /benchmarks/leaderboard.

Patrones prácticos

Algunas cosas que vale la pena saber antes de construir sobre la variante Custom Tools:

El diseño del esquema importa tanto como la elección del modelo. Incluso un modelo de uso de herramientas sólido se beneficia de esquemas claros, bien tipados y con documentación explícita de los campos.
Las descripciones de herramientas en el prompt del sistema tienen un peso real. Las descripciones vagas producen una selección inconsistente de herramientas; las descripciones específicas con ejemplos producen un comportamiento más fiable.
Los bucles de agentes largos siguen beneficiándose de contadores de pasos explícitos y mecanismos de reinicio. Incluso los modelos sólidos ocasionalmente quedan atrapados en bucles de reintento; construya para eso.
El modelo gestiona los fallos de herramientas más elegantemente que la variante base, pero los sistemas posteriores deben seguir esperando selecciones de herramientas ocasionalmente incorrectas. Construya verificación donde importa.
Para cargas de trabajo que mezclan uso de herramientas con visión o razonamiento de contexto largo, la variante Custom Tools hereda los puntos fuertes subyacentes de la vista previa 3.1 Pro en ambas dimensiones.

Notas de despliegue

API estándar de Google Gemini. La variante Custom Tools usa la misma superficie que la vista previa 3.1 Pro base, con la misma forma de parámetros para la integración de herramientas.

La disponibilidad regional sigue el patrón estándar de Vertex AI de Google. Las regiones de la UE están disponibles en contratos enterprise. El acceso a la API de consumidor estándar no fija una región.

Los precios del tier de vista previa no deben ser la base para la modelización de costes a largo plazo. La estructura de precios en la disponibilidad general puede diferir de las tarifas del tier de vista previa.

Para la planificación de migración de producción, valide el comportamiento de Custom Tools contra su ecosistema de herramientas específico. Las mejoras sobre la variante base son más claras en cargas de trabajo con uso intensivo de herramientas; la validación debe probar esos escenarios específicos.

Cuándo elegirlo

Use Gemini 3.1 Pro Preview Custom Tools cuando:

La carga de trabajo sea un bucle de agente de producción con integración intensiva de herramientas.
El comportamiento de uso de herramientas de la vista previa 3.1 Pro base sea bueno pero necesite la mejora marginal de fiabilidad.
Los límites de tasa del tier de vista previa y las consideraciones de comportamiento sean aceptables.
El coste de los fallos del bucle de agente sea suficientemente alto como para justificar el modelo especializado.

Elija otra opción cuando:

La carga de trabajo no depende en gran medida de la integración de herramientas. Use la vista previa 3.1 Pro base.
Necesite un comportamiento estable en producción hoy. Use 2.5 Pro con prompts de uso de herramientas cuidadosos.
La carga de trabajo sea sensible al coste a escala. Baje a una variante Flash.
Necesite despliegue auto-alojado o ajustado a medida.

El resumen: variante especializada de la vista previa 3.1 Pro para cargas de trabajo de agentes con uso intensivo de herramientas. Para las cargas de trabajo específicas donde la especialización importa, es la opción correcta. Para todo lo demás, la vista previa 3.1 Pro base o 2.5 Pro es el mejor punto de partida.

Pruébelo contra su propio bucle de agente en /live-test. Las diferencias son más claras en escenarios reales de uso de herramientas que en benchmarks sintéticos.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

Última prueba automática

21 jun 2026 · 04:57 UTC · Benchmark

Latencia P50

7298 ms

Latencia P95

—

Errores

0 / 6 ejecuciones

Última revisión por Equipo Tokonomix·24 de mayo de 2026