Ir al contenido
Tier A — Frontera
Se ejecuta en:USCreado en:United States
Google Gemini

Gemini 3 Pro Preview

Tier A — Frontera · 1.048576M tokens

Equipo editorial Tokonomix·Revisado por Mes Kalkan··

Gemini 3 Pro Preview es un modelo de lenguaje extenso experimental desarrollado por Google como parte de su familia de sistemas de IA Gemini. Esta versión preliminar está diseñada para mostrar capacidades avanzadas en tareas estándar de generación de texto, incluyendo razonamiento complejo, comprensión de contexto extendido y procesamiento matizado del lenguaje natural. El modelo se posiciona como una versión preliminar de investigación, permitiendo a desarrolladores e investigadores explorar sus capacidades antes de un despliegue comercial más amplio. La característica técnica más distintiva del modelo es su ventana de contexto de 1,048,576 tokens—equivalente a aproximadamente un millón de tokens—que le permite procesar y mantener coherencia a través de documentos, bases de código o historiales de conversación extremadamente largos. Esta capacidad de contexto extendido lo posiciona entre los modelos más capaces para tareas que requieren análisis de materiales extensos, como revisión de documentos legales, comprensión integral de código o síntesis de múltiples documentos. El modelo soporta flujos de trabajo estándar de generación de texto sin capacidades multimodales especializadas en esta configuración. Dentro de la línea de modelos de Google, Gemini 3 Pro Preview representa una iteración avanzada de la serie Gemini Pro, ofreciendo rendimiento mejorado sobre generaciones anteriores mientras mantiene el enfoque en casos de uso profesionales y para desarrolladores. Como versión preliminar, sirve como campo de pruebas para capacidades que eventualmente podrían integrarse en modelos Gemini de producción. El modelo es accesible a través de la infraestructura de la plataforma de IA de Google y está destinado a usuarios que requieren capacidades sofisticadas de comprensión y generación de lenguaje a escala.

Gemini 3 Pro Preview establece un nuevo estándar en procesamiento de contexto extremadamente largo, ofreciendo más de un millón de tokens para análisis de documentación técnica y bases de código completas.

Resumen de benchmarks Tokonomix
Sección 01

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰
Tarifas API — Gemini 3 Pro Preview
$2.00 por 1M de tokens de entrada
$12.00 por 1M de tokens de salida
≈ $0.0036 por conversación típica (800 tokens)
Precio entrada vs salida (por 1M de tokens)
por 1M de tokens de entrada$2.00
por 1M de tokens de salida$12.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.00

input / 1M

— no change

$12.00

output / 1M

— no change

2026-05-242026-05-242026-05-24
Input
Output
Price change
⟳ synced weekly
Sección 02

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Ventana de contexto de 1M tokensRazonamiento complejo avanzadoAnálisis de documentos extensosComprensión de repositorios completosCoherencia en conversaciones largasClasificación Tier A en rendimientoAcceso anticipado a innovaciones GoogleProcesamiento de lenguaje matizado

Debilidades

Estado experimental de previewSin capacidades multimodales especializadasGarantías limitadas para producciónDocumentación de casos de uso incompleta
Sección 03

Capacidades

outputTokenLimit: 65536
Sección 04

Preguntas frecuentes

Con 1,048,576 tokens de contexto, puede procesar aproximadamente 3-4 novelas completas, repositorios de código de tamaño medio, o cientos de documentos empresariales simultáneamente. Esto representa aproximadamente 750,000 palabras en inglés.

Para equipos que necesitan analizar documentos masivos o mantener coherencia en conversaciones extensas, Gemini 3 Pro Preview ofrece capacidades de contexto incomparables, aunque su estado experimental requiere consideración cuidadosa para cargas de producción críticas.

Análisis editorial Tokonomix
Sección 05

Disponibilidad

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 06

Veredictos del benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-544/100 · 67 runs
24 correct6 partial37 wrong36% accuracy
2026-05-24

Las mejoras significativas en latencia se ven contrarrestadas por una regresión en las capacidades de razonamiento.

Gemini 3 Pro Preview muestra una trayectoria de rendimiento mixta en su última ventana de benchmarks. El modelo logró una mejora modesta en la calidad general de 5,6 puntos, alcanzando 45,6 sobre 100, aunque esto se mantiene en la mitad inferior de los rangos de rendimiento competitivo. Lo más destacable es que la latencia mejoró drásticamente en un 55%, bajando de 18,5 segundos a 8,4 segundos en la mediana, lo que representa una mejora sustancial en el tiempo de respuesta que los usuarios notarán de inmediato. Sin embargo, las mejoras en calidad ocultan una volatilidad significativa a nivel de categoría. El modelo mantiene puntuaciones perfectas en tareas creativas y de codificación, demostrando sólidas capacidades en estos dominios. La precisión factual mejoró ligeramente, pasando de 50 a 55. El desarrollo preocupante es un colapso total en el rendimiento de razonamiento, que cayó de un respetable 75 a cero en la ventana actual. Adicionalmente, la categoría zorg descendió de 18 a 10, mientras que las capacidades multilingües ya no se miden en la actual suite de pruebas. La reducción del número de ejecuciones de prueba de 28 a 11 sugiere que estos resultados pueden tener mayor varianza y deben interpretarse con cierta cautela. Los usuarios que requieran sólidas capacidades de razonamiento deberían evaluar cuidadosamente si este modelo cubre sus necesidades, mientras que quienes se centren en aplicaciones creativas o de codificación pueden beneficiarse de la mayor velocidad y la calidad mantenida en esas áreas.

Quality

45.6

Latency p50

8,366 ms

Test runs

11

La latencia mejoró un 55 % Las áreas creativa y de codificación siguen siendo sólidas El razonamiento cayó a cero Se completaron menos ejecuciones de prueba
Sección 07

Perfil completo del modelo

Gemini 3 Pro Preview — illustration 1
Gemini 3 Pro Preview: el tier superior de próxima generación de Google

Nota — perfil prospectivo. Gemini 3 Pro Preview (gemini-3-pro-preview) es la vista previa del tier Pro de próxima generación de Google. El comportamiento, las capacidades y los límites de tasa cambiarán antes de la disponibilidad general.

La vista previa insignia de Google para la línea Pro 3.x. Una ventana de contexto de 1 048 576 tokens. Entrada de texto e imagen. El modelo que se sitúa en la cima de la línea de vista previa de Google y representa las capacidades más actuales que la familia Gemini ha enviado a los desarrolladores.

Si ha estado en 2.5 Pro y tiene cargas de trabajo específicas donde la calidad ha sido el factor limitante, esta es la actualización que probar. También es el modelo para comparar con las últimas instantáneas de Anthropic Opus y OpenAI GPT-5 cuando se elige un modelo de tier superior desde cero en 2026.

Dónde encaja esta instantánea en la línea

La historia actual del tier Pro en la familia Gemini:

  • 2.5 Pro es la elección de producción estable. Comportamiento bien entendido, límites de tasa establecidos, integración madura con la superficie más amplia de Vertex AI.
  • 3 Pro Preview es la vista previa de próxima generación. Capacidades más recientes, mejoras más amplias sobre 2.5 Pro, consideraciones de comportamiento del tier de vista previa.
  • 3.1 Pro Preview es el refinamiento sobre 3 Pro Preview. La variante 3.1 aborda los bordes ásperos que introdujo 3 Pro Preview. Más cercana a donde se dirige la línea 3.x en la disponibilidad general.

Para nuevas construcciones en la familia 3.x, 3.1 Pro Preview es generalmente el punto de partida más actual. La vista previa 3 Pro sigue siendo relevante para cargas de trabajo validadas contra esta instantánea específica o para fines de comparación y benchmarking.

Qué hace bien

La generación Pro 3.x aporta mejoras significativas sobre 2.5 Pro:

  • Razonamiento más agudo en tareas de múltiples pasos. Las cadenas de pensamiento se mantienen coherentes más profundamente, y el modelo tiene menos probabilidades de perder el rastro de las restricciones intermedias en problemas complejos.
  • Mejor calidad de atención en contexto largo en profundidad. La ventana de 1M era utilizable en 2.5 Pro; en 3 Pro Preview la calidad de síntesis pasadas las 400k tokens de entrada es notablemente más ajustada.
  • Adherencia mejorada a la salida estructurada en esquemas anidados complejos.
  • Mejor calidad de visión en documentos densos y gráficos complejos.
  • Postura de rechazo más consistente con razonamiento suficientemente visible como para depurar un falso positivo.

Las mejoras se acumulan. El efecto compuesto es un tier superior que hace más de lo que un tier superior debería hacer.

La gestión multimodal es uno de los diferenciadores visibles frente a los modelos frontier de la competencia. La calidad de visión nativa combinada con la ventana de contexto de 1M significa que las cargas de trabajo que mezclan documentos largos con imágenes o gráficos integrados funcionan bien en una sola llamada en lugar de requerir orquestación de múltiples pasos.

Qué hace mal

Aplican las consideraciones del tier de vista previa. Los límites de tasa, la disponibilidad regional y los comportamientos específicos pueden cambiar antes de la disponibilidad general. Para cargas de trabajo de producción que necesitan un comportamiento estable hoy, 2.5 Pro sigue siendo la opción más conservadora.

La vista previa 3.1 Pro es el refinamiento que cerró varios bordes ásperos en esta instantánea 3 Pro Preview. Para cargas de trabajo donde esos refinamientos importan, la variante 3.1 es el objetivo actual mejor.

La latencia en el tier Pro es mayor que en los tiers Flash, como era de esperar. La generación 3.x no cambia ese intercambio fundamental.

El coste por llamada en el tier Pro es significativo. Para cargas de trabajo de alto volumen, el argumento para quedarse en Pro depende de si la carga de trabajo genuinamente necesita la calidad del tier superior.

El despliegue auto-alojado no está disponible. Google no distribuye pesos Gemini. Para cargas de trabajo que necesitan on-premise, la encuesta de pesos abiertos en /usecases/local es el punto de partida correcto.

Su posición frente al campo

Frente al tier superior de Anthropic: Claude Opus 4.7 ofrece la misma ventana de contexto de 1M con un estilo de razonamiento diferente. Opus es más cauteloso, más explícito, más lento; 3 Pro Preview es más rápido con gestión multimodal nativa más sólida. La elección depende de si la carga de trabajo valora el razonamiento cuidadoso al estilo Opus o la salida directa al estilo Gemini.

Frente al tier superior de OpenAI: GPT-5 compite en razonamiento y a menudo es más rápido en prompts cortos. 3 Pro Preview gana en multimodalidad nativa más allá de imágenes y en que la ventana de contexto de 1M es utilizable para síntesis.

Frente a la línea Gemini: 2.5 Pro para estabilidad de producción. 3.1 Pro Preview para la capacidad más actual del tier de vista previa. 3 Pro Preview es el punto intermedio en términos de actualidad y refinamiento.

El panorama por categorías está en /benchmarks/leaderboard y las puntuaciones por categoría en /benchmarks/intelligence.

Cuándo no es la herramienta adecuada

Cargas de trabajo de producción que necesitan un comportamiento estable hoy. Use 2.5 Pro.

Clasificación barata de alto volumen. La computación del tier superior es el gasto con la forma equivocada para enviar millones de prompts cortos. Baje a una variante Flash.

Voz conversacional en tiempo real. Sin entrada de audio nativa. La guía de pipeline de voz en /usecases/voice cubre la arquitectura correcta.

Generación de código donde la mejor adaptación al IDE importa más que la profundidad de razonamiento. El modelo es competente en código pero no está especializado. La encuesta de modelos en /usecases/code cubre las alternativas.

Cualquier cosa que necesite respuesta sub-segundo en entradas largas. La latencia en profundidad en la ventana de contexto es real.

Cargas de trabajo donde importan los refinamientos de 3.1 Pro Preview sobre esta instantánea 3 Pro. Use 3.1 Pro Preview directamente.

Patrones prácticos

Algunas cosas que vale la pena saber antes de construir sobre 3 Pro Preview:

  • Para cargas de trabajo que combinan entrada de contexto largo con visión, este modelo gestiona bien ambas dimensiones en una sola llamada. Aproveche eso en lugar de orquestar alternativas de múltiples pasos.
  • El caché de prompts es el patrón correcto para consultas repetidas contra el mismo corpus grande. Recargar 800k tokens en cada llamada es costoso aunque la API tenga éxito.
  • Estructurar la entrada larga con encabezados de sección claros ayuda al modelo a encontrar lo que importa. La atención de contexto largo es buena, no mágica.
  • El uso de herramientas es suficientemente fiable para construir bucles de agentes de producción sin necesidad de capas de parsing defensivo. Para cargas de trabajo con uso intensivo de herramientas, la variante Custom Tools de 3.1 Pro Preview añade ajuste especializado.
  • El comportamiento del tier de vista previa puede cambiar antes de la disponibilidad general. Valide los contratos posteriores contra las salidas del modelo y planifique la posibilidad de cambios.

Notas de despliegue

API estándar de Google Gemini. REST, streaming, uso de herramientas, salida estructurada: todo se comporta como se espera para la superficie de capacidad del tier Pro. La integración con las herramientas más amplias de Vertex AI para monitoreo, registro y controles de seguridad es limpia.

La disponibilidad regional sigue el patrón estándar de Vertex AI de Google. Las regiones de la UE están disponibles en contratos enterprise. El acceso a la API de consumidor estándar no fija una región. Para restricciones estrictas de residencia, la documentación regional de Vertex AI es la referencia correcta.

Los precios del tier de vista previa no deben ser la base para la modelización de costes a largo plazo. La estructura de precios en la disponibilidad general puede diferir de las tarifas del tier de vista previa.

Los límites de tasa y la estabilidad del comportamiento son las principales consideraciones operacionales durante la vista previa. La planificación de migración de producción debe tener en cuenta la posibilidad de cambios de comportamiento antes de la disponibilidad general.

Cuándo elegirlo

Use Gemini 3 Pro Preview cuando:

  • Explore las capacidades del tier superior de próxima generación para futuro despliegue en producción.
  • La carga de trabajo estaba limitada por 2.5 Pro en profundidad de razonamiento o síntesis de contexto largo.
  • Haya validado contra esta instantánea específica y la migración a 3.1 Pro Preview aún no esté justificada.
  • Los límites de tasa del tier de vista previa y las consideraciones de comportamiento sean aceptables.

Elija otra opción cuando:

  • Necesite un comportamiento estable en producción hoy. Use 2.5 Pro.
  • Quiera los refinamientos de vista previa más actuales. Migre a 3.1 Pro Preview.
  • La carga de trabajo sería adecuadamente atendida por una variante Flash. Baje para reducir coste.
  • Necesite consistencia de rechazo que coincida con el estilo Opus de Anthropic.
  • El trabajo es nativo de audio, voz o vídeo.

El resumen: sólida vista previa del tier Pro de próxima generación que avanza significativamente sobre 2.5 Pro. Para exploración del tier de vista previa y diseño prospectivo, 3.1 Pro Preview es generalmente la opción más actual. Para cargas de trabajo validadas contra esta instantánea 3 Pro Preview, sigue siendo relevante. Para despliegue estable en producción hoy, 2.5 Pro es la opción conservadora.

Pruébelo frente a las alternativas con sus propios prompts en /live-test.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

Gemini 3 Pro Preview — illustration 2Gemini 3 Pro Preview — illustration 3
Última prueba automática
27 may 2026 · 21:59 UTC · Benchmark
Latencia P50
Latencia P95
Errores
1 / 6 ejecuciones
Última revisión por Equipo Tokonomix·24 de mayo de 2026