¿Para qué tareas está mejor preparado?

Generación de texto, respuesta a preguntas, resumen de contenido y aplicaciones conversacionales estándar.

¿Está disponible para uso general?

Forma parte del catálogo de Google Gemini; consulta la documentación oficial para disponibilidad actual.

¿Tiene capacidades de visión?

En esta variante se centra en generación de texto; las capacidades de imagen dependen de la configuración del endpoint.

Tier B — Producción

Se ejecuta en:USCreado en:United States

Google Gemini

Nano Banana 2

Tier B — Producción · 66K tokens

Equipo editorial Tokonomix·Revisado por Mes Kalkan·Publicado 22 de mayo de 2026·Última revisión 24 de mayo de 2026

Nano Banana 2 es un modelo estándar de generación de texto desarrollado por Google como parte de la familia de modelos Gemini. Está diseñado para tareas de procesamiento de lenguaje natural de propósito general, incluyendo completado de texto, respuesta a preguntas, resúmenes y aplicaciones conversacionales. El modelo procesa y genera texto similar al humano a partir de indicaciones de entrada, lo que lo hace adecuado para integrarse en diversas aplicaciones que requieren capacidades de comprensión y generación de lenguaje. El modelo cuenta con una ventana de contexto de 66,000 tokens, lo que le permite procesar y mantener coherencia en documentos moderadamente largos o conversaciones extendidas. Esta capacidad de contexto permite al modelo manejar diálogos de múltiples turnos, analizar documentos de extensión razonable y mantener información relevante a lo largo de las interacciones. Nano Banana 2 admite entradas y salidas estándar basadas en texto, sin capacidades multimodales como procesamiento de imágenes o audio. Dentro de la línea Gemini de Google, Nano Banana 2 ocupa una posición como modelo compacto optimizado para un despliegue eficiente, manteniendo capacidades funcionales de generación de texto. Representa un equilibrio entre eficiencia computacional y rendimiento, lo que lo hace apropiado para aplicaciones donde las restricciones de recursos son una consideración, pero las tareas de lenguaje estándar aún requieren capacidad adecuada. El modelo está diseñado para atender casos de uso que requieren generación de texto confiable sin la carga computacional de los modelos más grandes de la familia Gemini.

Modelo de texto de la familia Gemini con ventana de 65K tokens, diseñado para tareas de procesamiento de lenguaje natural de uso general.
— Resumen de benchmark Tokonomix

Sección 01

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰

Tarifas API — Nano Banana 2

$0.5000 por 1M de tokens de entrada

$3.00 por 1M de tokens de salida

≈ $0.0009 por conversación típica (800 tokens)

Precio entrada vs salida (por 1M de tokens)

por 1M de tokens de entrada$0.5000

por 1M de tokens de salida$3.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.5000

input / 1M

— stable

$3.00

output / 1M

— stable

2026-05-242026-06-212026-07-26

Input

Output

Price change

⟳ synced weekly

Sección 02

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Generación de texto versátil65K tokens de contextoCapacidad conversacional multi-turnoResumen y análisis de documentosIntegración vía API de GoogleModelo compacto y eficiente

Debilidades

Contexto menor que modelos Gemini flagshipSin capacidades multimodales en esta varianteRazonamiento limitado respecto a modelos mayoresDocumentación técnica reducida

Sección 03

Capacidades

source: litellmvisionjson modejson schemaimage editingprompt cachingimage generationoutputTokenLimit: 65536max output tokens: 32768

Sección 04

Preguntas frecuentes

Aproximadamente 65.000 tokens, adecuado para documentos medianos y conversaciones extendidas.

Una opción eficiente de la línea Gemini para aplicaciones que no requieren contextos extremadamente largos.
— Resumen de benchmark Tokonomix

Sección 05

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 06

Veredictos del benchmark Tokonomix

⚖️

Endorsed by 1 judge

Independent LLM judges evaluated this model on our weekly intelligence tests

claude-sonnet-4-593/100 · 78 runs

69 correct8 partial1 wrong88% accuracy

● 2026-07-26

Nano Banana 2 adds six capabilities but remains untested on benchmarks

Nano Banana 2 continues to lack performance data across all benchmark categories for the second consecutive window. Despite this absence of measurable results, Google has significantly expanded the model's feature set with six new capabilities: vision, JSON mode, JSON schema, image editing, prompt caching, and image generation. This represents a substantial technical evolution from a text-only model to a multimodal system with structured output support and media manipulation features. However, without benchmark scores in areas like MMLU, HumanEval, or GPQA, users have no empirical basis to evaluate the model's actual performance in reasoning, coding, mathematics, or visual understanding tasks. The gap between announced capabilities and demonstrated performance creates uncertainty for potential adopters who need to assess whether Nano Banana 2 can deliver on its expanded promise. Until Google provides benchmark results or independent testing becomes available, organizations considering this model for production use should proceed with caution and conduct their own evaluations. The situation suggests either the model is still in early development stages or Google is prioritizing feature development over performance transparency.

Quality

—

Latency p50

—

Test runs

✓ Six new capabilities added✓ Multimodal support now available✗ No benchmark data available✗ Performance remains unverified

Sección 07

Perfil completo del modelo

Nano Banana 2: el modelo de imagen de próxima generación en la familia Flash de Google

Nota — perfil prospectivo. Nano Banana 2 (gemini-3.1-flash-image-preview) es la vista previa de imagen Flash 3.1. El comportamiento, las capacidades y los límites de tasa cambiarán antes de la disponibilidad general.

Nano Banana 2 es la iteración de próxima generación del modelo de generación de imágenes de tier Flash de Google. Un contexto de 65 536 tokens para el prompt y el material de referencia: el doble del espacio de prompt del Nano Banana original. Salida de imagen a partir de texto o entrada de texto más imagen de referencia. El nombre del producto no ha cambiado; el modelo que lo sustenta ha sido significativamente mejorado.

Esta no es una página de LLM de texto. El modelo produce imágenes, no párrafos. Todo lo que sigue trata sobre la calidad de generación, las superficies de control y dónde se sitúa el segundo Nano Banana frente al original y frente al campo más amplio de generación de imágenes.

Qué cambió respecto al original

La generación 3.1 Flash aporta varias mejoras sobre el modelo de imagen 2.5 Flash:

Renderización de texto dentro de imágenes más sólida. El Nano Banana original ya era una de las mejores opciones para texto en imagen; Nano Banana 2 produce una tipografía notablemente más limpia, formas de caracteres más fiables y mejor gestión de pasajes de texto más largos.
Mayor fidelidad en los detalles finos. Manos, texturas de tela, detalles mecánicos: áreas donde la generación de imágenes ha tenido históricamente dificultades, muestran una mejora significativa.
Mejor adherencia a los prompts composicionales. "Cuatro paneles con X, Y, Z, W" o "un plano amplio con sujeto en primer plano y contexto de fondo" produce una salida más precisa sin necesidad de ingeniería de prompts elaborada.
Condicionamiento por imagen de referencia más fiable. La consistencia de personajes entre múltiples generaciones es más sólida; la transferencia de estilo desde una imagen de referencia es más fiel.
Ventana de contexto de prompt duplicada. Instrucciones más largas, más material de referencia y prompts más matizados caben en una sola llamada.

Más allá de las mejoras titulares, la experiencia práctica es que los prompts que funcionaban parcialmente en el original ahora funcionan de forma fiable en la segunda generación.

Dónde brilla

Algunas cargas de trabajo donde Nano Banana 2 es genuinamente competitivo con los líderes especializados en generación de imágenes:

Maquetas de UI con texto detallado y diseños estructurados. El texto es legible, los diseños son coherentes y la salida es utilizable en revisión de diseño sin retoque importante.
Material de marketing con contenido textual sustancial. Carteles, banners y gráficos para redes sociales con múltiples elementos de texto funcionan con limpieza.
Storyboarding y trabajo de estilo cómic donde la consistencia de personajes importa entre muchos fotogramas.
Maquetas de producto con elementos de marca donde la fidelidad del texto importa.
Gráficos educativos e instructivos donde las etiquetas, los diagramas y el texto explicativo deben ser legibles y precisos.

Cuándo no es la herramienta adecuada

Trabajo de retrato fotorrealista en el nivel más alto. Los líderes de fotorrealismo especializados siguen teniendo ventaja en rostros humanos y textura de piel en el extremo muy alto de la calidad.

Trabajo artístico muy estilizado en estéticas reconocibles específicas donde el objetivo es un estilo artístico-histórico particular. Los modelos entrenados específicamente en esos estilos a menudo los expresan de forma más auténtica.

Resoluciones de salida muy grandes para impresión de alta gama sin un paso de escalado. Verifique los límites de resolución en la documentación actual de la API según sus necesidades específicas.

Generación de vídeo. Esto son imágenes fijas. Los modelos de generación de vídeo de Google cubren la categoría de vídeo.

Contenido que cae fuera del filtrado de seguridad estándar. El filtrado se aplica de forma consistente; las cargas de trabajo que necesitan legítimamente contenido fuera de esos filtros necesitan un proveedor diferente.

Cómo se compara con hermanos y competidores

Frente al Nano Banana original: Nano Banana 2 es la actualización natural para nuevas construcciones. Para despliegues existentes, el argumento de migración depende de si las mejoras de calidad importan para su caso de uso específico y de si los límites de tasa del tier de vista previa funcionan para su tráfico.

Frente a Nano Banana Pro: Pro es el hermano de tier superior con mejoras adicionales de fidelidad y un condicionamiento por imagen de referencia más sólido. Para cargas de trabajo donde la calidad es el requisito dominante y el coste es secundario, Pro es la opción. Para cargas de trabajo donde la latencia y el coste del tier Flash forman parte del requisito, Nano Banana 2 alcanza un buen equilibrio.

Frente a opciones de generación de imágenes no Google: Midjourney mantiene su posición en fotorrealismo y en trabajo artístico estilizado. Las variantes Stable Diffusion de gama alta compiten en flexibilidad y en despliegue auto-alojable. Los modelos de imagen de OpenAI compiten en integración con su stack más amplio. Para cargas de trabajo en el stack de Google donde la renderización de texto dentro de imágenes y el condicionamiento por imagen de referencia importan, Nano Banana 2 se encuentra entre las opciones más sólidas.

Patrones prácticos

Algunas cosas que vale la pena saber antes de construir sobre Nano Banana 2:

La estructura del prompt sigue importando. Las mejoras sobre el original hacen los prompts más tolerantes, pero las instrucciones composicionales específicas siguen produciendo mejores salidas que las descripciones vagas.
Las imágenes de referencia tienen un peso significativo. Para la consistencia de personajes, la transferencia de estilo o la orientación composicional específica, incluya una referencia en lugar de describirla solo en texto.
La latencia de generación es razonable para el tier Flash. Planifique patrones de UX que muestren progreso y permitan la iteración en lugar de bloquear en una sola generación.
La ventana de prompt duplicada invita a prompts más complejos. Úsela: los prompts más largos y específicos producen salidas más controladas.
La iteración sigue siendo parte del flujo de trabajo. Incluso los prompts fuertes a menudo necesitan dos o tres generaciones para dar con la mejor salida.

Notas de despliegue

API estándar de Google Gemini para los endpoints de generación de imágenes. El formato de solicitud sigue el mismo patrón que el Nano Banana original con el espacio de parámetros adicional para la ventana de contexto más grande.

La disponibilidad regional sigue el patrón estándar de Vertex AI de Google. Las regiones de la UE están disponibles en contratos enterprise. El acceso a la API de consumidor estándar no fija una región.

El filtrado de seguridad se aplica a las imágenes generadas. El comportamiento del filtro es consistente con las políticas de contenido más amplias de Google. Las cargas de trabajo con necesidades legítimas fuera de esas políticas necesitarán un proveedor completamente diferente.

Las imágenes generadas llevan marcas de agua y metadatos de procedencia en línea con los compromisos de Google en torno al contenido generado por IA. Para cargas de trabajo donde esto importa en cualquier sentido, consulte la documentación actual de la API sobre qué es y no es configurable.

Aplican las consideraciones del tier de vista previa. Los límites de tasa, la disponibilidad regional y los comportamientos específicos pueden cambiar antes de la disponibilidad general. Para cargas de trabajo de producción que necesitan un comportamiento estable, el Nano Banana original sigue siendo la opción más conservadora por el momento.

Cuándo elegirlo

Use Nano Banana 2 cuando:

Necesite la renderización de texto mejorada, los detalles más finos o la ventana de prompt más grande sobre el Nano Banana original.
La carga de trabajo sea maquetas de UI, material de marketing o storyboarding donde la calidad importa.
Esté dispuesto a aceptar los límites de tasa y las consideraciones de comportamiento del tier de vista previa.
Ya esté en el stack de Google y quiera permanecer en él.

Elija otra opción cuando:

El Nano Banana original cubre su carga de trabajo y la actualización al tier de vista previa añade riesgo sin valor.
Necesite fidelidad de primer nivel para retrato o trabajo artístico estilizado.
El trabajo es generación de vídeo en lugar de imágenes fijas.
La generación de imágenes auto-alojada o ajustada a medida forma parte del requisito.

El resumen: sólida ruta de actualización desde el Nano Banana original con mejoras significativas en renderización de texto, detalles finos y control de prompts. Para cargas de trabajo de tier de vista previa donde las mejoras justifican el coste de migración, es la elección correcta. Para cargas de trabajo de producción donde la estabilidad importa más que la actualización, el original sigue siendo una opción razonable.

Pruébelo con un prompt real en /live-test. La salida de generación de imágenes es suficientemente subjetiva como para que deba verla en su propio caso de uso antes de comprometerse.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

Última prueba automática

21 jun 2026 · 04:49 UTC · Benchmark

Latencia P50

4330 ms

Latencia P95

—

Errores

0 / 6 ejecuciones

Última revisión por Equipo Tokonomix·24 de mayo de 2026