Ir al contenido
Tier C — Especialista
Se ejecuta en:USCreado en:United States
Google Gemini

Gemini 3.1 Pro Preview Custom Tools

Tier C — Especialista · 1.048576M tokens

Equipo editorial Tokonomix·Revisado por Mes Kalkan··

Gemini 3.1 Pro Preview Custom Tools es una versión experimental del modelo Gemini 3.1 Pro de Google que incorpora capacidades ampliadas de uso de herramientas. Esta variante está diseñada para desarrolladores e investigadores que exploran la invocación avanzada de funciones y la integración de herramientas externas en aplicaciones de modelos de lenguaje de gran tamaño. Permite que el modelo interactúe con APIs personalizadas, bases de datos y servicios externos mediante una interfaz estructurada de llamada a herramientas, lo que lo hace adecuado para construir agentes de IA complejos y sistemas de automatización de flujos de trabajo. El modelo cuenta con una ventana de contexto de aproximadamente 1.048 millones de tokens, lo que le permite procesar y mantener conversaciones, documentos o cadenas de razonamiento de varios pasos extremadamente largos. Esta capacidad extendida de contexto resulta especialmente útil para aplicaciones que requieren el análisis de bases de código extensas, la revisión exhaustiva de documentos o sesiones de diálogo prolongadas. El modelo ofrece capacidades estándar de generación de texto junto con su funcionalidad mejorada de uso de herramientas, dando soporte tanto a aplicaciones de IA conversacional como a implementaciones orientadas a tareas que requieren acceso a datos externos o la ejecución de acciones. Dentro del catálogo de modelos de Google, esta variante se posiciona como una versión preliminar especializada del nivel Gemini 3.1 Pro, ubicada entre los modelos estándar de producción y los lanzamientos experimentales de vanguardia. Ofrece a los desarrolladores acceso anticipado a la arquitectura de uso de herramientas en evolución de Google, manteniendo a la vez las capacidades fundamentales de razonamiento y generación de la base Gemini 3.1 Pro. La designación "Preview" indica que se trata de una versión previa al lanzamiento, destinada a pruebas y retroalimentación, no a su despliegue en producción.

Gemini 3.1 Pro Preview Custom Tools es una variante experimental orientada a quienes necesitan llevar la integración de herramientas externas más allá de lo convencional. Su ventana de contexto de más de un millón de tokens lo posiciona como una opción seria para agentes complejos y flujos de trabajo extensos.

Resumen editorial de Tokonomix
Sección 01

Análisis de velocidad

Latencia medida en todas las ejecuciones de benchmark. P50 (mediana) y P95 (percentil 95) dan una imagen realista de la velocidad de respuesta bajo carga normal y máxima.

Latencia P50 (mediana)Latencia P9514 runs
109741807263103451342805-2705-31ms
Sección 02

Puntuaciones de calidad

Resultados de evaluación de modelos juez en diversas categorías de tareas. Las puntuaciones reflejan coherencia, precisión y seguimiento de instrucciones.

43
Generación de código
27
Multilingüe
45
Razonamiento
Sección 03

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰
Tarifas API — Gemini 3.1 Pro Preview Custom Tools
$2.00 por 1M de tokens de entrada
$12.00 por 1M de tokens de salida
≈ $0.0036 por conversación típica (800 tokens)
Precio entrada vs salida (por 1M de tokens)
por 1M de tokens de entrada$2.00
por 1M de tokens de salida$12.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.00

input / 1M

— stable

$12.00

output / 1M

— stable

2026-05-242026-06-072026-06-14
Input
Output
Price change
⟳ synced weekly
Sección 04

Tokens por segundo

Rendimiento en tokens por segundo, derivado de la latencia P50 medida. Más alto es mejor; las fluctuaciones reflejan la carga del lado del proveedor.

Rendimiento (tokens / s)156 / avg 140
18189

Estimado a partir de latencia P50 × 200 tokens de salida — el número absoluto depende de esta suposición; lo que importa es la tendencia.

Sección 05

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Contexto de 1M+ tokensTool-calling extendido y personalizadoApto para agentes complejosIntegración con APIs externasRazonamiento multi-paso prolongadoAnálisis de documentos extensosComprensión de bases de código grandesAcceso temprano a arquitectura de tools

Debilidades

Naturaleza experimental, sin garantía de estabilidadClasificación de Tier C limita producción críticaCapacidades multimodales no confirmadasDisponibilidad regional incierta en preview
Sección 06

Capacidades

toolssource: litellmvisionjson modepdf inputreasoningaudio inputjson schemaprompt cachingoutputTokenLimit: 65536max output tokens: 65536
Sección 07

Preguntas frecuentes

No del todo. Al ser una preview experimental con clasificación Tier C, conviene reservarlo para prototipos, pruebas internas o entornos donde se acepte cierta variabilidad en el comportamiento.

Una preview interesante para equipos que ya tienen claro qué quieren construir con tool-calling avanzado, aunque su carácter experimental obliga a tratarlo como pieza de I+D más que como motor de producción. Si tu caso de uso vive del contexto largo y la orquestación de APIs, merece una prueba seria.

Veredicto del equipo de Tokonomix
Sección 08

Disponibilidad

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 09

Veredictos del benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-545/100 · 76 runs
29 correct7 partial40 wrong38% accuracy
2026-06-14

New model debuts with extensive multimodal capabilities

Gemini 3.1 Pro Preview Custom Tools enters benchmarking with a comprehensive feature set spanning multiple input modalities and output formats. The model supports tools, vision, audio input, PDF processing, and structured output through both JSON mode and JSON schema capabilities. Reasoning and prompt caching features are also available. Without previous benchmark data for comparison, this represents the model's initial capability profile rather than performance changes. Users gain access to a versatile multimodal system that handles diverse input types including text, images, audio, and documents. The custom tools designation suggests enhanced function calling capabilities for agentic workflows. The preview status indicates this is a pre-release version that may undergo further refinement. As this is the first benchmark window with data, performance characteristics across these capabilities remain to be validated through continued testing. Organizations evaluating this model should conduct their own assessments for specific use cases, particularly given its preview nature. Future benchmark windows will establish performance trends and stability metrics across the newly available feature set.

Quality

Latency p50

Test runs

0

Multimodal input support added Structured output capabilities enabled Tool calling functions available Prompt caching now supported
Sección 10

Perfil completo del modelo

Gemini 3.1 Pro Preview Custom Tools — illustration 1
Gemini 3.1 Pro Preview Custom Tools: el especialista en bucles de agente

Nota — perfil prospectivo. Gemini 3.1 Pro Preview Custom Tools (gemini-3.1-pro-preview-customtools) es una instantánea de vista previa. El comportamiento, las capacidades y los límites de tasa cambiarán antes de la disponibilidad general.

Una variante especializada de la vista previa 3.1 Pro construida para cargas de trabajo que dependen en gran medida de la integración estructurada de herramientas. Una ventana de contexto de 1 048 576 tokens. Entrada de texto e imagen. La misma superficie de capacidad subyacente que la vista previa 3.1 Pro base, más un comportamiento mejorado de uso de herramientas ajustado para bucles de agentes de producción.

Si ha construido un sistema de agentes sobre un modelo Gemini de tier superior y ha tenido que escribir capas de parsing defensivo alrededor de la salida de llamadas a herramientas, esta variante está diseñada para su situación.

Qué añade realmente "Custom Tools"

La variante Custom Tools es el mismo modelo subyacente con un entrenamiento específico y un ajuste en el tiempo de inferencia para la integración de herramientas. Las diferencias respecto a la vista previa 3.1 Pro base se manifiestan en:

  • Payloads de llamadas a herramientas más fiables bajo esquemas complejos. La vista previa 3.1 Pro base ya es sólida aquí; la variante Custom Tools lo es aún más.
  • Mejor gestión de cadenas largas de resultados de herramientas donde el modelo necesita interpretar la salida de una herramienta para decidir qué herramienta llamar a continuación.
  • Recuperación de errores más limpia cuando una herramienta devuelve un resultado inesperado o falla por completo. El modelo tiene más probabilidades de reconocer el modo de fallo y reintentarlo con ajustes o escalarlo con limpieza.
  • Adherencia mejorada a las políticas de uso de herramientas: instrucciones sobre cuándo llamar a herramientas, cuándo preguntar al usuario, cuándo rechazar, cuándo diferir.
  • Visibilidad de razonamiento más consistente cuando el agente decide entre múltiples opciones de herramientas.

La vista previa 3.1 Pro base cubre la mayoría de las cargas de trabajo. La variante Custom Tools es para cargas de trabajo donde la mejora marginal en la fiabilidad del bucle de agente justifica suficientemente el modelo especializado.

Qué hace bien

Hereda los puntos fuertes subyacentes de la vista previa 3.1 Pro. La ventana de contexto de 1M con calidad de atención que se mantiene en profundidad. Gestión multimodal sólida. Profundidad de razonamiento de nivel superior. Entrada de visión nativa.

Sobre eso, el pulido del uso de herramientas. Los bucles de agentes de producción que antes necesitaban capas de parsing defensivo, arneses de reintento o ingeniería cuidadosa de esquemas tienden a funcionar de forma más limpia sin configuración adicional en esta variante.

El perfil de latencia es similar al de la vista previa 3.1 Pro base. El ajuste de Custom Tools no añade una sobrecarga de latencia significativa.

Qué hace mal

Aplican las consideraciones del tier de vista previa. Los límites de tasa, la disponibilidad regional y los comportamientos específicos pueden cambiar antes de la disponibilidad general.

Para cargas de trabajo que no dependen en gran medida de la integración de herramientas, la variante Custom Tools proporciona un valor marginal sobre la vista previa 3.1 Pro base. El ajuste especializado está diseñado para cargas de trabajo con uso intensivo de herramientas; para casos de uso con forma de chat o extracción, la variante base es el punto de partida correcto.

El coste por llamada en el tier Pro es significativo. Para bucles de agentes de alto volumen, el argumento de coste depende de si las mejoras de fiabilidad compensan el gasto a escala.

El despliegue auto-alojado no está disponible. Google no distribuye pesos Gemini.

Dónde brilla

Algunas cargas de trabajo donde la variante Custom Tools gana su posicionamiento especializado:

  • Bucles de agentes de producción que orquestan muchas llamadas a herramientas por tarea y necesitan alta fiabilidad a lo largo de la cadena.
  • Ecosistemas de herramientas complejos con esquemas profundamente anidados donde la adherencia al esquema bajo presión importa.
  • Flujos de trabajo donde las salidas de herramientas son en sí mismas complejas y el modelo necesita interpretarlas cuidadosamente para decidir qué hacer a continuación.
  • Sistemas de agentes con políticas estrictas de uso de herramientas —cuándo llamar a herramientas, cuándo diferir, cuándo escalar— donde la adherencia a esas políticas importa para el diseño operacional.
  • Casos de uso donde el coste de un fallo del bucle de agente es suficientemente alto como para justificar el modelo especializado.

Cuándo no es la herramienta adecuada

Cargas de trabajo que no usan herramientas de forma intensiva. La vista previa 3.1 Pro base es el punto de partida correcto: misma superficie del modelo, aplicabilidad más amplia.

Cargas de trabajo de producción que necesitan un comportamiento estable hoy. La base 2.5 Pro cubre el uso de herramientas de forma sólida para la mayoría de las cargas de trabajo; la variante Custom Tools en tier de vista previa aún no es la opción correcta para bucles de agentes críticos en producción.

Clasificación barata de alto volumen o trabajo con prompts cortos. La computación del tier superior es el gasto con la forma equivocada para estas cargas de trabajo independientemente de la variante.

Cualquier cosa fuera de la entrada de texto e imagen. Voz, audio, vídeo son familias de modelos diferentes.

Cómo se compara con las alternativas

Frente a la vista previa 3.1 Pro base: la variante Custom Tools es una mejora marginal en la fiabilidad del uso de herramientas para cargas de trabajo con uso intensivo de herramientas. Para trabajo sin uso intensivo de herramientas, la variante base es la opción correcta.

Frente a 2.5 Pro con prompts de uso de herramientas personalizados: para cargas de trabajo donde ya se ha invertido en ingeniería cuidadosa de prompts y parsing defensivo alrededor del comportamiento de uso de herramientas de 2.5 Pro, la aritmética de migración depende de si la variante Custom Tools permite simplificar esa arquitectura circundante de forma significativa.

Frente a Claude Opus con uso de herramientas habilitado: Opus tiene su propio comportamiento sólido de uso de herramientas con la postura de rechazo al estilo Anthropic. Para cargas de trabajo donde el razonamiento cuidadoso al estilo Opus encaja mejor, esa es la opción correcta. Para cargas de trabajo donde la salida más rápida y directa de Gemini encaja mejor, la variante Custom Tools es la opción más orientada al bucle de agente.

Frente al tier superior de OpenAI con salidas estructuradas y llamadas a funciones: ambos ecosistemas han invertido fuertemente en la fiabilidad del uso de herramientas. La elección a menudo se reduce al encaje con el ecosistema en lugar de la capacidad bruta.

El panorama por categorías está en /benchmarks/leaderboard.

Patrones prácticos

Algunas cosas que vale la pena saber antes de construir sobre la variante Custom Tools:

  • El diseño del esquema importa tanto como la elección del modelo. Incluso un modelo de uso de herramientas sólido se beneficia de esquemas claros, bien tipados y con documentación explícita de los campos.
  • Las descripciones de herramientas en el prompt del sistema tienen un peso real. Las descripciones vagas producen una selección inconsistente de herramientas; las descripciones específicas con ejemplos producen un comportamiento más fiable.
  • Los bucles de agentes largos siguen beneficiándose de contadores de pasos explícitos y mecanismos de reinicio. Incluso los modelos sólidos ocasionalmente quedan atrapados en bucles de reintento; construya para eso.
  • El modelo gestiona los fallos de herramientas más elegantemente que la variante base, pero los sistemas posteriores deben seguir esperando selecciones de herramientas ocasionalmente incorrectas. Construya verificación donde importa.
  • Para cargas de trabajo que mezclan uso de herramientas con visión o razonamiento de contexto largo, la variante Custom Tools hereda los puntos fuertes subyacentes de la vista previa 3.1 Pro en ambas dimensiones.

Notas de despliegue

API estándar de Google Gemini. La variante Custom Tools usa la misma superficie que la vista previa 3.1 Pro base, con la misma forma de parámetros para la integración de herramientas.

La disponibilidad regional sigue el patrón estándar de Vertex AI de Google. Las regiones de la UE están disponibles en contratos enterprise. El acceso a la API de consumidor estándar no fija una región.

Los precios del tier de vista previa no deben ser la base para la modelización de costes a largo plazo. La estructura de precios en la disponibilidad general puede diferir de las tarifas del tier de vista previa.

Para la planificación de migración de producción, valide el comportamiento de Custom Tools contra su ecosistema de herramientas específico. Las mejoras sobre la variante base son más claras en cargas de trabajo con uso intensivo de herramientas; la validación debe probar esos escenarios específicos.

Cuándo elegirlo

Use Gemini 3.1 Pro Preview Custom Tools cuando:

  • La carga de trabajo sea un bucle de agente de producción con integración intensiva de herramientas.
  • El comportamiento de uso de herramientas de la vista previa 3.1 Pro base sea bueno pero necesite la mejora marginal de fiabilidad.
  • Los límites de tasa del tier de vista previa y las consideraciones de comportamiento sean aceptables.
  • El coste de los fallos del bucle de agente sea suficientemente alto como para justificar el modelo especializado.

Elija otra opción cuando:

  • La carga de trabajo no depende en gran medida de la integración de herramientas. Use la vista previa 3.1 Pro base.
  • Necesite un comportamiento estable en producción hoy. Use 2.5 Pro con prompts de uso de herramientas cuidadosos.
  • La carga de trabajo sea sensible al coste a escala. Baje a una variante Flash.
  • Necesite despliegue auto-alojado o ajustado a medida.

El resumen: variante especializada de la vista previa 3.1 Pro para cargas de trabajo de agentes con uso intensivo de herramientas. Para las cargas de trabajo específicas donde la especialización importa, es la opción correcta. Para todo lo demás, la vista previa 3.1 Pro base o 2.5 Pro es el mejor punto de partida.

Pruébelo contra su propio bucle de agente en /live-test. Las diferencias son más claras en escenarios reales de uso de herramientas que en benchmarks sintéticos.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

Gemini 3.1 Pro Preview Custom Tools — illustration 2
Última prueba automática
14 jun 2026 · 05:02 UTC · Benchmark
Latencia P50
6069 ms
Latencia P95
Errores
0 / 6 ejecuciones
Última revisión por Equipo Tokonomix·24 de mayo de 2026