¿Cómo se diferencia de los modelos Gemini estándar?

Mientras los modelos Gemini generales priorizan respuestas conversacionales rápidas, Deep Research Pro ejecuta flujos de trabajo estructurados: descompone preguntas complejas, recopila información sistemáticamente y produce reportes con referencias verificables. No está diseñado para chat interactivo.

¿Es adecuado para integraciones de producción actualmente?

Su designación Preview indica estado experimental con capacidades sujetas a cambios. Equipos que requieren estabilidad contractual deberían esperar a una versión de disponibilidad general o mantener planes de contingencia.

¿Qué tipo de tareas de investigación maneja mejor?

Sobresale en análisis técnicos profundos, revisiones de literatura académica, comparativas multi-dominio, due diligence tecnológica y cualquier tarea que requiera sintetizar decenas de fuentes con razonamiento crítico.

¿Puede procesar documentos largos en una sola sesión?

Con 131,072 tokens de contexto, puede procesar aproximadamente 100,000 palabras simultáneamente, suficiente para múltiples artículos académicos, documentación técnica extensa o reportes corporativos completos en una sola inferencia.

Tier B — Producción

Se ejecuta en:USCreado en:United States

Google Gemini

Deep Research Pro Preview (Dec-12-2025)

Tier B — Producción · 131K tokens

Equipo editorial Tokonomix·Revisado por Mes Kalkan·Publicado 22 de mayo de 2026·Última revisión 24 de mayo de 2026

Deep Research Pro Preview es un modelo experimental de la familia Gemini de Google, lanzado en diciembre de 2025. Representa una variante especializada diseñada específicamente para tareas de investigación complejas que requieren razonamiento extendido y síntesis integral de información. El modelo se construye sobre la arquitectura de modelo de lenguaje fundamental de Google con modificaciones optimizadas para flujos de trabajo de análisis profundo en lugar de chat de propósito general o respuestas rápidas. Este modelo cuenta con una ventana de contexto de 131,000 tokens, lo que le permite procesar cantidades sustanciales de información en una sola sesión. A diferencia de los modelos conversacionales estándar, Deep Research Pro Preview está diseñado para realizar procesos de investigación de múltiples pasos, incluyendo descomposición de consultas, recopilación sistemática de información, evaluación de fuentes y síntesis de hallazgos en informes estructurados. Destaca en tareas que requieren investigación exhaustiva de temas técnicos, análisis comparativo entre múltiples dominios y producción de documentación detallada con referencias adecuadas. Dentro de la línea Gemini de Google, Deep Research Pro Preview ocupa un nicho especializado distinto de los modelos Gemini de propósito general y las variantes enfocadas en código. Mientras los modelos Gemini estándar priorizan la fluidez conversacional y cobertura amplia de tareas, este modelo orientado a investigación sacrifica velocidad de respuesta por profundidad y exhaustividad. La designación "Preview" indica su estatus experimental, con capacidades y comportamientos sujetos a refinamiento basado en retroalimentación de usuarios. Está posicionado para usuarios que requieren capacidades analíticas rigurosas en lugar de interacción rápida, como investigadores, analistas y profesionales que realizan evaluaciones técnicas profundas.

Deep Research Pro Preview redefine el modelo de investigación asistida por IA, priorizando profundidad analítica sobre velocidad de respuesta en un contexto de 131K tokens.
— Análisis de arquitectura Tokonomix

Sección 01

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰

Tarifas API — Deep Research Pro Preview (Dec-12-2025)

$2.00 por 1M de tokens de entrada

$12.00 por 1M de tokens de salida

≈ $0.0036 por conversación típica (800 tokens)

Precio entrada vs salida (por 1M de tokens)

por 1M de tokens de entrada$2.00

por 1M de tokens de salida$12.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.00

input / 1M

— stable

$12.00

output / 1M

— stable

2026-05-242026-06-282026-07-26

Input

Output

Price change

⟳ synced weekly

Sección 02

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Investigación multi-paso con descomposición de consultasVentana de contexto de 131K tokensEvaluación crítica de fuentes integradaSíntesis estructurada con documentación exhaustivaAnálisis comparativo entre dominios técnicosTrazabilidad completa de hallazgos a fuentesArquitectura optimizada para razonamiento extendidoGeneración de reportes técnicos detallados

Debilidades

Latencia elevada por diseño de investigación profundaEstado experimental con cambios frecuentes esperadosNivel de servicio desconocido para producciónNo optimizado para conversación casual rápida

Sección 03

Capacidades

source: litellmvisionjson modejson schemaprompt cachingoutputTokenLimit: 65536max output tokens: 32768

Sección 04

Preguntas frecuentes

Las sesiones de investigación profunda pueden extenderse varios minutos dependiendo de la complejidad de la consulta y el número de fuentes a sintetizar. Este modelo sacrifica deliberadamente velocidad por exhaustividad analítica.

Para equipos que requieren análisis exhaustivos con síntesis compleja, este modelo establece un nuevo estándar, aunque su estado experimental exige tolerancia a iteraciones frecuentes.
— Evaluación editorial Tokonomix

Sección 05

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 06

Veredictos del benchmark Tokonomix

● 2026-07-26

New modalities added, but core performance largely unchanged

Deep Research Pro Preview adds vision capabilities and structured output modes including JSON schema support and prompt caching, expanding its technical versatility. However, these additions have not translated into meaningful performance improvements across core benchmarks. The model maintains a 64.9% coding score, showing no progress from the previous window, while mathematical reasoning remains stagnant at 51.8%. Instruction following improved modestly to 75.9%, suggesting incremental refinement in task adherence. The model continues to struggle with complex reasoning tasks, performing adequately on straightforward coding challenges but faltering when deeper analytical thinking is required. Vision support opens new use cases for multimodal applications, and structured output modes will benefit developers building production systems requiring reliable data formatting. The addition of prompt caching should reduce operational costs for repetitive query patterns. Overall, this release prioritizes feature expansion over performance optimization. Users seeking a capable multimodal assistant with structured output support will find value, but those requiring exceptional mathematical or advanced reasoning capabilities should temper expectations until future iterations address these persistent weaknesses.

Quality

—

Latency p50

—

Test runs

✓ Vision and JSON modes added✓ Instruction following slightly improved✗ Math performance remains flat✗ No coding score improvement

Sección 07

Perfil completo del modelo

Deep Research Pro Preview (dic. de 2025): el tier Pro original del stack de investigación de Google

Nota — perfil prospectivo. Deep Research Pro Preview (deep-research-pro-preview-12-2025) es la instantánea de vista previa de diciembre de 2025. El comportamiento, las capacidades y los límites de tasa cambiarán antes de la disponibilidad general y probablemente han variado desde que llegó esta instantánea.

Deep Research Pro Preview es la instantánea de diciembre de 2025 que introdujo el tier Pro de la familia Deep Research. Una ventana de contexto de 131 072 tokens. Síntesis de formato largo con citas. Un bucle agéntico que extrae fuentes, las lee y produce un informe estructurado.

Se sitúa entre el tier base de Deep Research Preview y el tier Max en la curva profundidad-velocidad. Más exhaustivo que el base, más rápido que Max. Durante un período a principios de 2026, fue la única opción de tier Pro en esta familia.

Dónde encaja esta instantánea hoy

Algunas situaciones donde esta instantánea Pro de diciembre de 2025 sigue siendo la elección correcta en lugar de la base o Max de vista previa de abril de 2026:

Evaluaciones ancladas y suites de regresión donde el comportamiento estable del bucle agéntico durante meses importa más que una capacidad más reciente.
Flujos de trabajo auditados contra la distribución de salida de esta instantánea específica que aún no han sido re-validados.
Acceso continuado donde las vistas previas de abril de 2026 están con límites de tasa o temporalmente no disponibles en una región determinada.

Si ninguna de esas situaciones aplica, la vista previa base o Max de abril de 2026 es generalmente el mejor punto de partida actual. La vista previa base es más rápida; la vista previa Max va más profundo.

Qué hace en realidad

La forma del trabajo es la misma que la del resto de la familia Deep Research. Se envía una pregunta que se beneficia de fuentes actuales y citas explícitas. El agente ejecuta múltiples búsquedas dirigidas, lee los resultados más relevantes, los cruza y produce una respuesta estructurada:

Un resumen ejecutivo al inicio.
Descomposición en sub-preguntas.
Citas para cada afirmación factual con material de fuente citado.
Una lista de fuentes utilizadas.

Las ejecuciones suelen tomar entre treinta segundos y un par de minutos según la complejidad de la pregunta. La salida es más larga y exhaustiva que la vista previa base, más corta y rápida que Max.

Dónde resulta genuinamente útil

La misma forma de caso de uso que el resto de la familia:

Síntesis entre múltiples fuentes sobre temas donde la evidencia está dispersa en varias fuentes primarias.
Informes de formato largo que necesitan ser defendibles ante un revisor externo.
Preguntas regulatorias o de política donde el resumen superficial difiere de lo que dicen los documentos subyacentes.
Trabajo de investigación donde la respuesta correcta requiere leer múltiples fuentes en lugar de resumir un artículo secundario.

El patrón: las tareas donde un humano pasaría media hora a una hora leyendo con atención encajan bien en este tier Pro. Las tareas más cortas encajan en la vista previa base. Las más largas encajan en Max.

Cómo se compara con las vistas previas más recientes

Frente a Deep Research Preview (abril de 2026), el tier base: la vista previa base es más rápida y produce salidas más cortas. Pro Preview va más profundo. Si su carga de trabajo ya estaba en el límite de lo que el tier base podía manejar, Pro es el objetivo natural de actualización.

Frente a Deep Research Max Preview (abril de 2026): Max opera durante más tiempo, lee más fuentes y produce una salida más exhaustiva al coste de más latencia. Si su carga de trabajo requiere una profundidad que Pro apenas no alcanza, Max es la opción.

Para cargas de trabajo donde la instantánea Pro de diciembre de 2025 ha sido validada y funciona, rara vez hay una razón de calidad sólida para migrar. Las instantáneas más recientes refinan el bucle agéntico y el comportamiento de citación, pero la forma principal de la salida es similar.

Cómo se compara fuera de la familia

Las comparaciones más directas son los modos aumentados con búsqueda en la serie GPT-5 de OpenAI y la familia Claude de Anthropic con herramientas de búsqueda web habilitadas. La forma de la salida es similar —respuesta con citas— pero el estilo del agente difiere.

Deep Research Pro de Google tiende a extraer de fuentes más diversas que una alternativa de llamada de búsqueda única. La salida es más estructurada por defecto pero menos conversacional. Claude con búsqueda web es más cauteloso y muestra más advertencias visibles. OpenAI con navegación es más rápido en la misma pregunta y produce salidas más conversacionales.

Para cargas de trabajo de investigación donde importan la densidad de citas y la estructura, la familia Deep Research —incluido el tier Pro— es competitiva. Para investigación interactiva donde el usuario quiere refinar la pregunta a mitad de la ejecución, las opciones de Claude u OpenAI encajan mejor.

El panorama por categorías está en /benchmarks/intelligence y el leaderboard en /benchmarks/leaderboard.

Cuándo no es la herramienta adecuada

Interacciones conversacionales. No es la forma correcta de modelo.

Llamadas de alto volumen. Cada llamada cuesta computación significativa y toma tiempo considerable. No es una herramienta para chatbots.

Cualquier cosa que no sea investigación literal. Código, depuración, trabajo con imágenes: familia equivocada por completo.

Cargas de trabajo donde la actualidad más allá de la fecha de corte de indexación importa más que la profundidad. El bucle de búsqueda y citación es solo tan reciente como el índice del que extrae.

Notas de despliegue

API estándar de Google Gemini. Los modelos Deep Research comparten la superficie Gemini más amplia, pero requieren un identificador de modelo explícito y aceptan parámetros específicos del bucle agéntico.

Planifique patrones de cola y callback en lugar de respuestas en streaming. El agente produce actualizaciones de progreso intermedias durante una ejecución, pero la síntesis final llega al final. La latencia en el rango de treinta a noventa segundos es típica para este tier Pro en preguntas moderadas.

La disponibilidad regional sigue el patrón estándar de Vertex AI de Google. Las regiones de la UE están disponibles en contratos enterprise. El acceso a la API de consumidor estándar no fija una región. Para restricciones estrictas de residencia, consulte la documentación regional de Vertex AI en lugar de depender del comportamiento de la API pública.

Cuándo elegirlo

Use Deep Research Pro Preview (diciembre de 2025) cuando:

Tenga una carga de trabajo existente validada contra esta instantánea específica.
El comportamiento estable del bucle agéntico durante meses importe para su caso de uso.
Una migración a las vistas previas de abril de 2026 aún no esté presupuestada o justificada.

Elija otra opción cuando:

Elija un tier Deep Research desde cero en 2026. La vista previa base o Max de abril de 2026 es generalmente el mejor punto de partida.
La carga de trabajo necesite una profundidad más allá de lo que Pro proporciona. Suba a Max.
La carga de trabajo sería adecuadamente atendida por el tier base más rápido. Baje.
El caso de uso es cualquier cosa que no sea síntesis de investigación literal con citas.

El resumen: una instantánea de tier Pro ancable de finales de 2025 que sigue haciendo su trabajo. Para nuevas construcciones, las vistas previas de abril de 2026 son generalmente la mejor opción. Para despliegues existentes, rara vez hay una razón de calidad sólida para migrar.

Pruébela con una pregunta de investigación real en /live-test y compare con los tiers de vista previa más recientes de la misma familia.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

Última prueba automática

21 jun 2026 · 04:52 UTC · Benchmark

Latencia P50

—

Latencia P95

—

Errores

1 / 6 ejecuciones

Última revisión por Equipo Tokonomix·24 de mayo de 2026