
Nota — perfil prospectivo. Deep Research Preview (
deep-research-preview-04-2026) es la instantánea de vista previa de abril de 2026. El comportamiento, las capacidades y los límites de tasa cambiarán antes de la disponibilidad general.
Deep Research Preview es el tier base de la línea Deep Research de Google. Una ventana de contexto de 131 072 tokens. La generación aumentada con búsqueda como capacidad principal: el modelo extrae fuentes en tiempo real durante su ejecución en lugar de depender solo de los datos de entrenamiento, y produce citas para las afirmaciones que hace.
No es un modelo de chat. Tampoco es el pesado agente de investigación del tier Max. Se sitúa en el medio como el tier de búsqueda con citas: más rápido que Max, más exhaustivo que un modelo de chat simple con una herramienta de búsqueda añadida.
Qué hace en realidad
Se le da una pregunta que se beneficia de información actual y citas explícitas. Ejecuta una búsqueda web enfocada, lee los resultados más relevantes y produce una respuesta estructurada que cita el material fuente. Salida típica:
- Respuesta directa a la pregunta.
- Un breve apoyo, de dos a cinco párrafos según la forma de la pregunta.
- Citas en línea a las fuentes utilizadas.
- Una lista de fuentes consultadas al final.
Las ejecuciones son más rápidas que las del tier Max de Deep Research y la salida es más corta. Se paga por la actualidad y la fiabilidad de las citas en lugar de por una síntesis profunda entre múltiples fuentes.
Dónde resulta genuinamente útil
Algunas cargas de trabajo donde este tier encaja con claridad:
- Preguntas con sensibilidad temporal donde la fecha de corte de entrenamiento del modelo dejaría fuera la respuesta correcta.
- Salidas que requieren citas, donde un modelo de chat sin herramientas explícitas de búsqueda y citación inventaría referencias o se negaría a comprometerse.
- Consultas rápidas sobre documentación actual, texto de política o noticias donde el usuario necesita la respuesta más un enlace a la fuente.
- Investigación ligera que no justifica el coste de latencia de la síntesis profunda del tier Max.
El patrón: las tareas donde de otro modo se abrirían tres o cuatro pestañas, se leería durante diez minutos y se escribiría un párrafo encajan bien en este modelo. Las que necesitan una hora de lectura deben ir a Max. Las que ya tienen la respuesta en los datos de entrenamiento no necesitan aumento con búsqueda.
Cuándo no es la herramienta adecuada
Interacciones conversacionales. Como el resto de la familia Deep Research, esto es solicitud y respuesta, no chat.
Síntesis profunda entre múltiples fuentes con evidencia contradictoria. El tier Max lo maneja mejor. La vista previa base es más rápida pero lee menos.
Cualquier cosa fuera de la investigación literal. Generación de código, depuración, trabajo con imágenes: familia equivocada por completo.
Cargas de trabajo de muy alto volumen. El bucle de búsqueda y citación añade latencia y consume más computación por llamada que una simple completación de chat. Planifique en consecuencia.
Cómo se compara dentro de la familia
Las tres instantáneas de vista previa de Deep Research cubren diferentes puntos en la curva profundidad-velocidad:
- Deep Research Preview (abril de 2026) — este modelo. Tier base, más rápido, salidas más cortas.
- Deep Research Pro Preview (diciembre de 2025) — tier Pro más antiguo, más profundidad que el base, bucle de agente algo más antiguo.
- Deep Research Max Preview (abril de 2026) — tier más profundo, ejecuciones más largas, salida más exhaustiva.
Comience con la vista previa base para la mayoría de las cargas de trabajo. Suba a Pro o Max cuando encuentre que el tier base deja fuentes importantes sin leer o produce salidas que carecen de la profundidad que su uso posterior necesita.
Cómo se compara con otros modelos aumentados con búsqueda
Las comparaciones más directas son los modos aumentados con búsqueda en la familia GPT-5 de OpenAI y la línea Claude de Anthropic con herramientas de búsqueda web habilitadas. La forma de la salida es similar: una respuesta con citas.
Deep Research Preview base de Google tiende a extraer fuentes más diversas que una alternativa de llamada de búsqueda única, porque el agente ejecuta múltiples búsquedas dirigidas en lugar de una amplia. La salida es más estructurada por defecto pero menos conversacional que lo que GPT-5 con navegación produce. Claude con búsqueda web es el más cauteloso, rechaza con confianza cuando las fuentes no coinciden y tiende a mostrar más advertencias en la salida.
Para flujos de trabajo de pregunta e iteración interactivos, Claude o GPT-5 encajan mejor. Para preguntas de un solo paso donde el usuario quiere una respuesta completa con citas y está dispuesto a esperar entre quince y cuarenta segundos, Deep Research Preview es un valor predeterminado sólido.
El panorama por categorías está en /benchmarks/intelligence y el leaderboard actualizado en /benchmarks/leaderboard.
Calidad de las citas en la práctica
Dos cosas que hay que saber sobre cómo se comportan las citas:
Primera: las citas rastrean el contenido real de la fuente de forma fiable. El modelo no tiene el hábito de fabricar referencias, y cuando cita un pasaje de una fuente, ese pasaje generalmente está presente en esa fuente. Esto no es universal entre los modelos aumentados con búsqueda; algunos competidores siguen inventando ocasionalmente citas de aspecto plausible.
Segunda: la cobertura de citas se inclina hacia fuentes recientes y de alto tráfico. Si la respuesta correcta a su pregunta vive en un sitio de archivo pequeño, un PDF en un portal gubernamental o un artículo académico que no aparece bien en la búsqueda web general, el modelo tiene menos probabilidades de recuperarlo. Para dominios de investigación especializados donde las fuentes correctas están fuera de la web de alto tráfico, esto importa.
Notas de despliegue
API estándar de Google Gemini. Los modelos Deep Research comparten la superficie Gemini más amplia, pero requieren un identificador de modelo explícito y aceptan parámetros específicos del bucle de búsqueda y citación.
La latencia es la principal consideración operacional. Las llamadas suelen tomar entre quince y cuarenta segundos según la complejidad de la pregunta. Planifique eso en su UX: muestre progreso, establezca expectativas del usuario, no lo ponga detrás de una interacción síncrona donde el usuario espera una respuesta sub-segundo.
La disponibilidad regional sigue el patrón estándar de Vertex AI de Google. Las regiones de la UE están disponibles en contratos enterprise; el acceso a la API estándar no fija una región. Para restricciones estrictas de residencia, consulte la documentación regional de Vertex AI en lugar de depender del comportamiento de la API pública.
Cuándo elegirlo
Use Deep Research Preview cuando:
- Necesite información actual con citas explícitas.
- La pregunta sea más grande que una búsqueda simple pero más pequeña que un informe de investigación de varias horas.
- La fiabilidad de las citas importe y quiera que el modelo rechace con limpieza cuando las fuentes no coinciden en lugar de inventar respuestas confiadas.
- Una latencia de entre quince y cuarenta segundos sea aceptable para su caso de uso.
Elija otra opción cuando:
- La pregunta necesite un intercambio interactivo para refinarse.
- La latencia sub-segundo forme parte del requisito.
- La pregunta requiera síntesis profunda entre muchas fuentes: el tier Max encaja mejor.
- La respuesta ya está en los datos de entrenamiento y el aumento con búsqueda añade latencia sin valor.
El resumen: herramienta de investigación sólida de peso medio. Más rápida que Max, más exhaustiva que una alternativa de chat con búsqueda, encaja en una franja de cargas de trabajo que no tenía una respuesta limpia antes de que esta familia saliera.
Pruébela con una pregunta de actualidad en /live-test. La calidad de las citas es el diferenciador y es más fácil de evaluar con sus propias preguntas.
Última revisión técnica: 2026-05-22 — Tokonomix.ai
