
Nota — perfil prospectivo. Gemini 3.1 Pro Preview Custom Tools (
gemini-3.1-pro-preview-customtools) es una instantánea de vista previa. El comportamiento, las capacidades y los límites de tasa cambiarán antes de la disponibilidad general.
Una variante especializada de la vista previa 3.1 Pro construida para cargas de trabajo que dependen en gran medida de la integración estructurada de herramientas. Una ventana de contexto de 1 048 576 tokens. Entrada de texto e imagen. La misma superficie de capacidad subyacente que la vista previa 3.1 Pro base, más un comportamiento mejorado de uso de herramientas ajustado para bucles de agentes de producción.
Si ha construido un sistema de agentes sobre un modelo Gemini de tier superior y ha tenido que escribir capas de parsing defensivo alrededor de la salida de llamadas a herramientas, esta variante está diseñada para su situación.
Qué añade realmente "Custom Tools"
La variante Custom Tools es el mismo modelo subyacente con un entrenamiento específico y un ajuste en el tiempo de inferencia para la integración de herramientas. Las diferencias respecto a la vista previa 3.1 Pro base se manifiestan en:
- Payloads de llamadas a herramientas más fiables bajo esquemas complejos. La vista previa 3.1 Pro base ya es sólida aquí; la variante Custom Tools lo es aún más.
- Mejor gestión de cadenas largas de resultados de herramientas donde el modelo necesita interpretar la salida de una herramienta para decidir qué herramienta llamar a continuación.
- Recuperación de errores más limpia cuando una herramienta devuelve un resultado inesperado o falla por completo. El modelo tiene más probabilidades de reconocer el modo de fallo y reintentarlo con ajustes o escalarlo con limpieza.
- Adherencia mejorada a las políticas de uso de herramientas: instrucciones sobre cuándo llamar a herramientas, cuándo preguntar al usuario, cuándo rechazar, cuándo diferir.
- Visibilidad de razonamiento más consistente cuando el agente decide entre múltiples opciones de herramientas.
La vista previa 3.1 Pro base cubre la mayoría de las cargas de trabajo. La variante Custom Tools es para cargas de trabajo donde la mejora marginal en la fiabilidad del bucle de agente justifica suficientemente el modelo especializado.
Qué hace bien
Hereda los puntos fuertes subyacentes de la vista previa 3.1 Pro. La ventana de contexto de 1M con calidad de atención que se mantiene en profundidad. Gestión multimodal sólida. Profundidad de razonamiento de nivel superior. Entrada de visión nativa.
Sobre eso, el pulido del uso de herramientas. Los bucles de agentes de producción que antes necesitaban capas de parsing defensivo, arneses de reintento o ingeniería cuidadosa de esquemas tienden a funcionar de forma más limpia sin configuración adicional en esta variante.
El perfil de latencia es similar al de la vista previa 3.1 Pro base. El ajuste de Custom Tools no añade una sobrecarga de latencia significativa.
Qué hace mal
Aplican las consideraciones del tier de vista previa. Los límites de tasa, la disponibilidad regional y los comportamientos específicos pueden cambiar antes de la disponibilidad general.
Para cargas de trabajo que no dependen en gran medida de la integración de herramientas, la variante Custom Tools proporciona un valor marginal sobre la vista previa 3.1 Pro base. El ajuste especializado está diseñado para cargas de trabajo con uso intensivo de herramientas; para casos de uso con forma de chat o extracción, la variante base es el punto de partida correcto.
El coste por llamada en el tier Pro es significativo. Para bucles de agentes de alto volumen, el argumento de coste depende de si las mejoras de fiabilidad compensan el gasto a escala.
El despliegue auto-alojado no está disponible. Google no distribuye pesos Gemini.
Dónde brilla
Algunas cargas de trabajo donde la variante Custom Tools gana su posicionamiento especializado:
- Bucles de agentes de producción que orquestan muchas llamadas a herramientas por tarea y necesitan alta fiabilidad a lo largo de la cadena.
- Ecosistemas de herramientas complejos con esquemas profundamente anidados donde la adherencia al esquema bajo presión importa.
- Flujos de trabajo donde las salidas de herramientas son en sí mismas complejas y el modelo necesita interpretarlas cuidadosamente para decidir qué hacer a continuación.
- Sistemas de agentes con políticas estrictas de uso de herramientas —cuándo llamar a herramientas, cuándo diferir, cuándo escalar— donde la adherencia a esas políticas importa para el diseño operacional.
- Casos de uso donde el coste de un fallo del bucle de agente es suficientemente alto como para justificar el modelo especializado.
Cuándo no es la herramienta adecuada
Cargas de trabajo que no usan herramientas de forma intensiva. La vista previa 3.1 Pro base es el punto de partida correcto: misma superficie del modelo, aplicabilidad más amplia.
Cargas de trabajo de producción que necesitan un comportamiento estable hoy. La base 2.5 Pro cubre el uso de herramientas de forma sólida para la mayoría de las cargas de trabajo; la variante Custom Tools en tier de vista previa aún no es la opción correcta para bucles de agentes críticos en producción.
Clasificación barata de alto volumen o trabajo con prompts cortos. La computación del tier superior es el gasto con la forma equivocada para estas cargas de trabajo independientemente de la variante.
Cualquier cosa fuera de la entrada de texto e imagen. Voz, audio, vídeo son familias de modelos diferentes.
Cómo se compara con las alternativas
Frente a la vista previa 3.1 Pro base: la variante Custom Tools es una mejora marginal en la fiabilidad del uso de herramientas para cargas de trabajo con uso intensivo de herramientas. Para trabajo sin uso intensivo de herramientas, la variante base es la opción correcta.
Frente a 2.5 Pro con prompts de uso de herramientas personalizados: para cargas de trabajo donde ya se ha invertido en ingeniería cuidadosa de prompts y parsing defensivo alrededor del comportamiento de uso de herramientas de 2.5 Pro, la aritmética de migración depende de si la variante Custom Tools permite simplificar esa arquitectura circundante de forma significativa.
Frente a Claude Opus con uso de herramientas habilitado: Opus tiene su propio comportamiento sólido de uso de herramientas con la postura de rechazo al estilo Anthropic. Para cargas de trabajo donde el razonamiento cuidadoso al estilo Opus encaja mejor, esa es la opción correcta. Para cargas de trabajo donde la salida más rápida y directa de Gemini encaja mejor, la variante Custom Tools es la opción más orientada al bucle de agente.
Frente al tier superior de OpenAI con salidas estructuradas y llamadas a funciones: ambos ecosistemas han invertido fuertemente en la fiabilidad del uso de herramientas. La elección a menudo se reduce al encaje con el ecosistema en lugar de la capacidad bruta.
El panorama por categorías está en /benchmarks/leaderboard.
Patrones prácticos
Algunas cosas que vale la pena saber antes de construir sobre la variante Custom Tools:
- El diseño del esquema importa tanto como la elección del modelo. Incluso un modelo de uso de herramientas sólido se beneficia de esquemas claros, bien tipados y con documentación explícita de los campos.
- Las descripciones de herramientas en el prompt del sistema tienen un peso real. Las descripciones vagas producen una selección inconsistente de herramientas; las descripciones específicas con ejemplos producen un comportamiento más fiable.
- Los bucles de agentes largos siguen beneficiándose de contadores de pasos explícitos y mecanismos de reinicio. Incluso los modelos sólidos ocasionalmente quedan atrapados en bucles de reintento; construya para eso.
- El modelo gestiona los fallos de herramientas más elegantemente que la variante base, pero los sistemas posteriores deben seguir esperando selecciones de herramientas ocasionalmente incorrectas. Construya verificación donde importa.
- Para cargas de trabajo que mezclan uso de herramientas con visión o razonamiento de contexto largo, la variante Custom Tools hereda los puntos fuertes subyacentes de la vista previa 3.1 Pro en ambas dimensiones.
Notas de despliegue
API estándar de Google Gemini. La variante Custom Tools usa la misma superficie que la vista previa 3.1 Pro base, con la misma forma de parámetros para la integración de herramientas.
La disponibilidad regional sigue el patrón estándar de Vertex AI de Google. Las regiones de la UE están disponibles en contratos enterprise. El acceso a la API de consumidor estándar no fija una región.
Los precios del tier de vista previa no deben ser la base para la modelización de costes a largo plazo. La estructura de precios en la disponibilidad general puede diferir de las tarifas del tier de vista previa.
Para la planificación de migración de producción, valide el comportamiento de Custom Tools contra su ecosistema de herramientas específico. Las mejoras sobre la variante base son más claras en cargas de trabajo con uso intensivo de herramientas; la validación debe probar esos escenarios específicos.
Cuándo elegirlo
Use Gemini 3.1 Pro Preview Custom Tools cuando:
- La carga de trabajo sea un bucle de agente de producción con integración intensiva de herramientas.
- El comportamiento de uso de herramientas de la vista previa 3.1 Pro base sea bueno pero necesite la mejora marginal de fiabilidad.
- Los límites de tasa del tier de vista previa y las consideraciones de comportamiento sean aceptables.
- El coste de los fallos del bucle de agente sea suficientemente alto como para justificar el modelo especializado.
Elija otra opción cuando:
- La carga de trabajo no depende en gran medida de la integración de herramientas. Use la vista previa 3.1 Pro base.
- Necesite un comportamiento estable en producción hoy. Use 2.5 Pro con prompts de uso de herramientas cuidadosos.
- La carga de trabajo sea sensible al coste a escala. Baje a una variante Flash.
- Necesite despliegue auto-alojado o ajustado a medida.
El resumen: variante especializada de la vista previa 3.1 Pro para cargas de trabajo de agentes con uso intensivo de herramientas. Para las cargas de trabajo específicas donde la especialización importa, es la opción correcta. Para todo lo demás, la vista previa 3.1 Pro base o 2.5 Pro es el mejor punto de partida.
Pruébelo contra su propio bucle de agente en /live-test. Las diferencias son más claras en escenarios reales de uso de herramientas que en benchmarks sintéticos.
Última revisión técnica: 2026-05-22 — Tokonomix.ai
