¿Para qué tareas es más eficiente?

Chatbots, asistentes de contenido, análisis de documentos de longitud media y generación de texto en múltiples formatos.

¿Tiene capacidades visuales?

En su configuración de texto estándar se centra en lenguaje; las capacidades de imagen dependen del endpoint específico.

¿Está listo para producción?

Sí, como parte del ecosistema Gemini de Google está disponible para integración en aplicaciones vía API.

Tier A — Frontera

Se ejecuta en:USCreado en:United States

Google Gemini

Nano Banana Pro

Tier A — Frontera · 131K tokens

Equipo editorial Tokonomix·Revisado por Mes Kalkan·Publicado 22 de mayo de 2026·Última revisión 24 de mayo de 2026

Nano Banana Pro es un modelo de generación de texto desarrollado por Google como parte de la familia Gemini. Está diseñado para tareas estándar de procesamiento de lenguaje natural, incluyendo generación de contenido, respuesta a preguntas, resúmenes y aplicaciones conversacionales generales. El modelo opera con una ventana de contexto de 131K tokens, lo que le permite procesar documentos de longitud moderada y mantener hilos conversacionales extensos. Desde una perspectiva técnica, Nano Banana Pro representa una oferta de gama media dentro del catálogo de modelos de Google. La ventana de contexto de 131K lo sitúa por encima de modelos con contexto más reducido, aunque por debajo de las capacidades de contexto extendido de las propuestas insignia de Google. Está construido para manejar cargas de trabajo típicas de generación de texto donde no se requiere un razonamiento extenso sobre documentos muy largos, lo que lo hace adecuado para aplicaciones como chatbots, asistencia de contenido, herramientas educativas y tareas de procesamiento de texto de propósito general. Dentro del ecosistema Google Gemini, Nano Banana Pro ocupa una posición práctica para desarrolladores que buscan capacidades fiables de generación de texto sin necesitar las funciones multimodales más avanzadas o contextos de longitud extendida. El modelo equilibra rendimiento funcional con accesibilidad, orientándose a casos de uso donde la comprensión y generación de lenguaje estándar son los requisitos principales. Resulta apropiado para entornos de producción donde la calidad consistente de salida de texto importa más que las características experimentales más vanguardistas.

Modelo de texto de nivel Pro de la familia Gemini con 131K tokens de contexto, adecuado para flujos de trabajo de complejidad media.
— Resumen de benchmark Tokonomix

Sección 01

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰

Tarifas API — Nano Banana Pro

$2.00 por 1M de tokens de entrada

$12.00 por 1M de tokens de salida

≈ $0.0036 por conversación típica (800 tokens)

Precio entrada vs salida (por 1M de tokens)

por 1M de tokens de entrada$2.00

por 1M de tokens de salida$12.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.00

input / 1M

— stable

$12.00

output / 1M

— stable

2026-05-242026-06-212026-07-26

Input

Output

Price change

⟳ synced weekly

Sección 02

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Generación de texto de calidad Pro131K tokens de contextoSoporte multi-turno sólidoAnálisis y resumen de documentosCasos de uso generales bien cubiertosAdecuado para chatbots y asistentes

Debilidades

Sin multimodalidad confirmada en texto puroContexto menor que modelos con 1M tokensRazonamiento inferior a modelos Ultra/flagshipDocumentación técnica limitada

Sección 03

Capacidades

source: litellmvisionjson modejson schemaimage editingprompt cachingimage generationoutputTokenLimit: 32768max output tokens: 32768

Sección 04

Preguntas frecuentes

Hasta aproximadamente 131.000 tokens, equivalente a un libro de tamaño mediano o cientos de páginas de documento.

Posicionado entre modelos compactos y los grandes modelos flagship, ofrece un balance práctico para aplicaciones de producción estándar.
— Resumen de benchmark Tokonomix

Sección 05

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 06

Veredictos del benchmark Tokonomix

⚖️

Endorsed by 1 judge

Independent LLM judges evaluated this model on our weekly intelligence tests

claude-sonnet-4-541/100 · 76 runs

25 correct2 partial49 wrong33% accuracy

● 2026-07-26

No performance data available for new benchmark window

The current benchmark window shows no performance results for Nano Banana Pro, making it impossible to assess changes from the previous period. The model previously demonstrated stable performance across various tasks after expanding its feature set to include vision, JSON handling, image editing, prompt caching, and image generation capabilities. Without current benchmark data, users cannot determine whether the model maintains its previous performance levels or if any regressions or improvements have occurred. The absence of results could indicate testing issues, model availability problems, or a gap in the benchmark collection process. Users relying on Nano Banana Pro should be aware that performance verification for this window is unavailable. Until new benchmark data becomes available, the most recent reference point remains the previous window's results, which showed consistent performance across supported capabilities. Organizations using this model in production should monitor their own performance metrics closely during this period of benchmark data absence.

Quality

—

Latency p50

—

Test runs

✗ No benchmark data available

Sección 07

Perfil completo del modelo

Nano Banana Pro: el generador de imágenes insignia de Google, en vista previa

Nano Banana Pro es la cima del stack de generación de imágenes de Google. Tras el nombre amigable para el consumidor se encuentra gemini-3-pro-image-preview, un modelo de tier de vista previa que produce imágenes fijas a partir de prompts de texto y, en la misma llamada, puede editar o ampliar imágenes proporcionadas. Es el tercer lanzamiento en la línea Nano Banana, tras el original (construido sobre Gemini 2.5 Flash Image) y Nano Banana 2 (sobre la vista previa Flash 3.1). La rama "Pro" es lo que Google posiciona frente a gpt-image-2 de OpenAI y el campo más amplio de generadores comerciales de pago.

Esta página trata sobre la versión de vista previa. Las capacidades y los precios cambian durante la vista previa; trate cualquier elemento a continuación como una instantánea.

En qué destaca

Tres áreas sobresalen en pruebas prácticas.

Salida fotorrealista sin aspecto plástico. Los lanzamientos anteriores de Nano Banana tenían un estilo de casa reconocible: piel ligeramente cerosa, color sobresaturado, ese brillo distintivo de "renderizado por IA" en las superficies metálicas. La versión Pro reduce mucho de eso. Los retratos parecen fotografías en lugar de CGI con más frecuencia. El modelo aún tiene señales si se mira de cerca, pero la brecha con un fotógrafo cuidadoso con un softbox se ha estrechado de una manera que la versión anterior no había logrado.

Edición de imágenes existentes. Se le pasa una fotografía más un prompt como "elimina a la persona de la izquierda, amplía el fondo, mantén la iluminación" y lo hace en un solo paso. El inpainting y el outpainting no son endpoints separados; son la misma llamada con una imagen adjunta. Aquí es donde Nano Banana Pro se adelanta claramente a los generadores de un solo paso que tienen que ir y volver por una interfaz de edición de máscaras.

Texto dentro de imágenes. Una debilidad de larga data de los modelos de difusión, las letras ininteligibles en carteles y los logotipos deformados, mejora significativamente aquí. Los eslóganes cortos, las etiquetas de producto y los títulos de gráficos se renderizan correctamente la mayor parte del tiempo. Los párrafos largos de texto aún se rompen. Si necesita cuerpo de texto preciso dentro de una imagen, sigue componiendo después.

Qué no hace

Nano Banana Pro es un generador de imágenes. No produce vídeo. No genera audio. El número de contexto de 131 072 tokens que puede ver en las tablas de especificaciones se refiere a cuánto texto acepta el modelo en un único prompt. Eso es útil cuando se pega una guía de estilo de marca detallada; no es útil para alimentarle un documento de 200 páginas.

También es un generador, no un copiador perfecto. La reproducción de marcas, los retratos de semejanza exacta de personas reales y los logotipos de marcas registradas se encuentran dentro de los guardianes de seguridad y política que Google ha establecido en la vista previa. Algunos de esos guardianes se relajarán en la disponibilidad general; otros no. Si su flujo de trabajo depende de reproducir un rostro específico o un logotipo específico con fidelidad a nivel de píxel, la respuesta es una herramienta diferente, normalmente un modelo que se ajusta a medida en el propio activo en cuestión.

Salida, resolución, latencia

El modelo produce imágenes en varias relaciones de aspecto predefinidas: cuadrada, retrato 9:16, paisaje 16:9, más algunas intermedias. La resolución de salida depende de la relación que se elija, pero el máximo práctico se sitúa en el extremo alto de lo que se usaría para una imagen de héroe en un sitio web sin escalado. Para impresión en A3 o mayor, sigue siendo necesario un paso de escalado dedicado tras la generación.

El tiempo de generación por imagen se sitúa en los segundos de un solo dígito para un prompt estándar con la configuración predeterminada. Los prompts complejos con imágenes de referencia adjuntas, o las operaciones de edición en una entrada de alta resolución, pueden llegar a diez o quince segundos. En comparación con la generación anterior de Nano Banana esto no es notablemente más rápido, pero es más consistente: se ve menos varianza entre una llamada rápida y una lenta desafortunada.

Para una comparación entre modelos de imagen en igualdad de condiciones, las pruebas continuas en /benchmarks/speed son una mejor fuente que las hojas de especificaciones.

Estilo de prompting

Nano Banana Pro responde bien a los prompts en lenguaje natural. No se necesita la pila de palabras clave separadas por comas que los modelos de difusión de la era SD-1.5 requerían. Una oración o dos describiendo la escena, la iluminación, la cámara y el ambiente suele ser suficiente.

También acepta dirección negativa en inglés sencillo. "Sin personas en el fondo." "Luz diurna, no atardecer." "Fotográfico, no ilustrado." Esto funciona tan bien como las marcas de parámetros. Eso lo hace accesible para usuarios no técnicos; los equipos de marketing le dan instrucciones al modelo de la misma forma que lo harían con un diseñador junior. También puede frustrar a los ingenieros de prompts que quieren un control detallado. Aún no hay equivalente a los pesos de prompt negativo finamente ajustados en los que confían los usuarios avanzados en los forks de difusión de peso abierto.

Para comparar cómo diferentes modelos de imagen manejan el mismo encargo, la página /usecases/content es el punto de partida correcto.

Dónde encaja y dónde no

Use Nano Banana Pro cuando quiera:

Visuales de marketing, piezas para redes sociales y creativos publicitarios con aspecto fotográfico.
Ediciones rápidas de imágenes existentes: eliminar un objeto, ampliar un fondo, cambiar una estación.
Variaciones de fotografía de producto a partir de una sola foto de referencia.
Imágenes de estilo de vida para publicaciones de blog y páginas de aterrizaje donde la fotografía de stock sería la alternativa obvia.

Elija otra opción cuando necesite:

Reproducción de activos de marca a nivel de píxel. Entrene un modelo ajustado a medida en su propia biblioteca de activos.
Garantías estrictas de uso comercial en cada salida durante la vista previa. Lea los términos actuales de Google detenidamente antes de utilizar salidas de vista previa en canales orientados al cliente.
Generación en dispositivo o completamente sin conexión. Nano Banana Pro es solo API. Para pipelines creativos que priorizan lo local, el resumen /usecases/local enumera las opciones de peso abierto más pequeñas que vale la pena conocer.
Texto largo renderizado dentro de la imagen. Componga.

Frente a las alternativas obvias

La decisión generalmente se reduce a tres familias: este tier Pro, gpt-image-2 de OpenAI y los tiers rápidos más pequeños (Nano Banana 2 sobre la vista previa Flash 3.1, y gpt-image-1-mini).

El tier Pro gana en retratos fotorrealistas y en calidad del modo de edición. gpt-image-2 de OpenAI gana en cierto trabajo de ilustración estilizada y en la adherencia al prompt cuando el prompt es inusual o paradójico. Los tiers rápidos más pequeños ganan en coste y en latencia cuando se generan docenas de variaciones para elegir una. Ninguno de estos es definitivo. Ejecute los mismos cinco prompts en los tres antes de comprometer a su equipo con uno de ellos.

El desglose completo por categorías rota mensualmente en /benchmarks/leaderboard.

Dos notas prácticas antes de empezar

Primera: vista previa significa vista previa. Los endpoints pueden cambiar sin mucho aviso, y las salidas que genera hoy pueden no ser reproducibles contra el mismo prompt el mes que viene. Construya su pipeline para que cambiar el modelo sea un cambio de configuración, no una refactorización.

Segunda: revise sus salidas. Los modelos de imagen siguen produciendo artefactos ocasionales: seis dedos, orejas derretidas, una silla con tres patas. Pro reduce la tasa en comparación con sus predecesores, pero no la elimina. Cualquier cosa que vaya ante un cliente debe pasar por un ojo humano primero.

Pruébelo en /live-test. Lado a lado con las alternativas, con su propio prompt.

Última revisión técnica: 2026-05-22 — Tokonomix.ai

Última prueba automática

21 jun 2026 · 04:51 UTC · Benchmark

Latencia P50

11201 ms

Latencia P95

—

Errores

0 / 6 ejecuciones

Última revisión por Equipo Tokonomix·24 de mayo de 2026