Peut-on l utiliser pour des tâches de codage ?

Oui pour les tâches de code simples à modérées, mais les modèles plus grands offrent une meilleure précision sur du code complexe.

Quelle est la capacité de la fenêtre de contexte ?

Ce modèle dispose d une fenêtre de 66 000 tokens, permettant de traiter des documents d une longueur raisonnable.

Ce modèle est-il orienté production ou expérimental ?

Il s agit d un modèle de production au sein de l écosystème Google AI, accessible via l API standard.

Gère-t-il les conversations longues ?

Oui, la fenêtre de contexte de 66 000 tokens permet de maintenir des conversations avec un historique substantiel.

Tier B — Production

Fonctionne en :USCréé en :United States

Google Gemini

Nano Banana 2

Tier B — Production · 66K tokens

Équipe éditoriale Tokonomix·Relu par Mes Kalkan·Publié le 22 mai 2026·Dernière relecture 26 mai 2026

Nano Banana 2 est un modèle standard de génération de texte développé par Google dans le cadre de la famille de modèles Gemini. Il est conçu pour des tâches générales de traitement du langage naturel, notamment la complétion de texte, la réponse aux questions, la synthèse et les applications conversationnelles. Le modèle traite et génère du texte semblable à celui produit par un humain à partir d'invites en entrée, ce qui le rend adapté à l'intégration dans diverses applications nécessitant des capacités de compréhension et de génération du langage. Le modèle dispose d'une fenêtre de contexte de 66,000 tokens, lui permettant de traiter et de maintenir la cohérence sur des documents modérément longs ou des conversations prolongées. Cette capacité contextuelle permet au modèle de gérer des dialogues à plusieurs tours, d'analyser des documents d'une longueur raisonnable et de conserver les informations pertinentes tout au long des interactions. Nano Banana 2 prend en charge les entrées et sorties textuelles standard, sans capacités multimodales telles que le traitement d'images ou d'audio. Au sein de la gamme Gemini de Google, Nano Banana 2 occupe la position d'un modèle compact, optimisé pour un déploiement efficace tout en conservant des capacités fonctionnelles de génération de texte. Il représente un équilibre entre efficacité computationnelle et performance, ce qui le rend approprié pour des applications où les contraintes de ressources constituent un facteur à considérer, mais où les tâches linguistiques standard exigent toujours des capacités adéquates. Le modèle est conçu pour répondre aux cas d'usage nécessitant une génération de texte fiable, sans la charge computationnelle des modèles plus volumineux de la famille Gemini.

Ce modèle compact de Google offre des capacités de génération textuelle généraliste avec une fenêtre de contexte de 66 000 tokens.
— Synthèse benchmark Tokonomix

Section 01

Historique des tarifs

Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.

💰

Tarifs API — Nano Banana 2

$0.5000 par 1M de tokens d'entrée

$3.00 par 1M de tokens de sortie

≈ $0.0009 par conversation typique (800 tokens)

Prix entrée vs sortie (par 1M de tokens)

par 1M de tokens d'entrée$0.5000

par 1M de tokens de sortie$3.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$0.5000

input / 1M

— stable

$3.00

output / 1M

— stable

2026-05-242026-06-212026-07-26

Input

Output

Price change

⟳ synced weekly

Section 02

Forces & faiblesses

Basé sur les résultats de benchmarks et les retours communautaires agrégés sur des cas d'usage réels.

Forces

Efficacité computationnelle élevéeFenêtre de 66 000 tokensGénération textuelle généralisteSupport de dialogues multi-toursBon compromis taille-performance

Faiblesses

Capacités inférieures aux grands modèlesPas de traitement multimodalRaisonnement complexe limitéDocumentation publique limitée

Section 03

Capacités

source: litellmvisionjson modejson schemaimage editingprompt cachingimage generationoutputTokenLimit: 65536max output tokens: 32768

Section 04

Questions fréquentes

Les chatbots, réponses automatiques, création de contenu légère et analyse de documents de taille modérée.

Un modèle Google pratique pour les déploiements nécessitant efficacité sans sacrifier la fenêtre de contexte.
— Synthèse benchmark Tokonomix

Section 05

Disponibilité

Pas encore de données

Nous n'avons pas encore enregistré suffisamment d'appels API pour afficher les statistiques de disponibilité de ce modèle. Les données apparaîtront dès que le modèle reçoit du trafic en direct.

Section 06

Verdicts benchmark Tokonomix

⚖️

Endorsed by 1 judge

Independent LLM judges evaluated this model on our weekly intelligence tests

claude-sonnet-4-593/100 · 78 runs

69 correct8 partial1 wrong88% accuracy

● 2026-07-26

Nano Banana 2 adds six capabilities but remains untested on benchmarks

Nano Banana 2 continues to lack performance data across all benchmark categories for the second consecutive window. Despite this absence of measurable results, Google has significantly expanded the model's feature set with six new capabilities: vision, JSON mode, JSON schema, image editing, prompt caching, and image generation. This represents a substantial technical evolution from a text-only model to a multimodal system with structured output support and media manipulation features. However, without benchmark scores in areas like MMLU, HumanEval, or GPQA, users have no empirical basis to evaluate the model's actual performance in reasoning, coding, mathematics, or visual understanding tasks. The gap between announced capabilities and demonstrated performance creates uncertainty for potential adopters who need to assess whether Nano Banana 2 can deliver on its expanded promise. Until Google provides benchmark results or independent testing becomes available, organizations considering this model for production use should proceed with caution and conduct their own evaluations. The situation suggests either the model is still in early development stages or Google is prioritizing feature development over performance transparency.

Quality

—

Latency p50

—

Test runs

✓ Six new capabilities added✓ Multimodal support now available✗ No benchmark data available✗ Performance remains unverified

Section 07

Profil complet du modèle

Nano Banana 2 : le modèle d'image de nouvelle génération dans la famille Flash de Google

Note — profil prospectif. Nano Banana 2 (gemini-3.1-flash-image-preview) est l'aperçu de génération d'images Flash 3.1. Le comportement, les capacités et les limites de débit évolueront avant la disponibilité générale.

Nano Banana 2 est l'itération de nouvelle génération du modèle de génération d'images de niveau Flash de Google. Un contexte de 65 536 tokens pour le prompt et le matériel de référence — le double de la capacité de prompt du Nano Banana original. Sortie d'image à partir d'un texte ou d'une entrée texte-plus-image-de-référence. Le nom du produit reste inchangé, le modèle qui le sous-tend est considérablement amélioré.

Ceci n'est pas une page sur un LLM textuel. Le modèle produit des images, pas des paragraphes. Tout ce qui suit concerne la qualité de génération, les surfaces de contrôle, et le positionnement de la deuxième génération de Nano Banana par rapport à l'original et au champ plus large de la génération d'images.

Ce qui a changé par rapport à l'original

La génération Flash 3.1 apporte plusieurs améliorations par rapport au modèle d'image Flash 2.5 :

Rendu de texte plus robuste dans les images. Le Nano Banana original était déjà parmi les meilleures options pour le texte dans les images ; Nano Banana 2 produit une typographie sensiblement plus nette, des formes de caractères plus fiables et une meilleure gestion des passages de texte plus longs.
Fidélité accrue sur les détails fins. Les mains, les textures de tissus, les détails mécaniques — zones où la génération d'images a historiquement rencontré des difficultés — montrent une amélioration significative.
Meilleure adhérence aux prompts compositionnels. « Quatre panneaux avec X, Y, Z, W » ou « un plan large avec un sujet au premier plan et un contexte d'arrière-plan » produit une sortie plus précise sans nécessiter d'ingénierie de prompt élaborée.
Conditionnement par image de référence plus fiable. La cohérence des personnages sur plusieurs générations est plus forte ; le transfert de style à partir d'une image de référence est plus fidèle.
Fenêtre de contexte de prompt doublée. Instructions plus longues, plus de matériel de référence, prompts plus nuancés, tout rentre désormais.

Au-delà des améliorations de type manchette, l'expérience pratique est que les prompts qui fonctionnaient approximativement sur l'original fonctionnent maintenant de manière fiable sur la deuxième génération.

Où il excelle

Quelques charges de travail où Nano Banana 2 est véritablement compétitif avec les leaders spécialisés de la génération d'images :

Maquettes d'interface utilisateur avec texte détaillé et mises en page structurées. Le texte est lisible, les mises en page sont cohérentes, la sortie est utilisable en révision de conception sans retouche majeure.
Matériel marketing avec un contenu textuel substantiel. Affiches, bannières, graphiques pour réseaux sociaux avec plusieurs éléments textuels fonctionnent proprement.
Storyboarding et travail de style bande dessinée où la cohérence des personnages compte sur de nombreuses images.
Maquettes de produits avec éléments de marque où la fidélité du texte compte.
Graphiques éducatifs et pédagogiques où les étiquettes, diagrammes et textes explicatifs doivent être lisibles et précis.

Où il n'est pas le bon outil

Travail de portrait photoréaliste au plus haut niveau. Les leaders spécialisés du photoréalisme conservent des avantages sur les visages humains et la texture de la peau au plus haut niveau de qualité.

Travail artistique hautement stylisé dans des esthétiques reconnaissables spécifiques où l'objectif est un style artistico-historique particulier. Les modèles spécifiquement entraînés sur ces styles les expriment souvent de manière plus authentique.

Résolutions de sortie très grandes pour l'impression haut de gamme sans étape de mise à l'échelle. Vérifiez les limites de résolution dans la documentation API actuelle par rapport à vos besoins spécifiques.

Génération vidéo. Ce sont toujours des images fixes. Les modèles de génération vidéo de Google couvrent la catégorie vidéo.

Contenu qui sort du filtrage de sécurité standard. Le filtrage est appliqué de manière cohérente ; les charges de travail qui ont légitimement besoin de contenu en dehors de ces filtres nécessitent un fournisseur différent.

Comment il se compare aux modèles apparentés et concurrents

Par rapport au Nano Banana original. Nano Banana 2 est la mise à niveau naturelle pour les nouvelles constructions. Pour les déploiements existants, le cas de migration dépend de si les améliorations de qualité comptent pour votre cas d'usage spécifique et si les limites de débit au niveau aperçu fonctionnent pour votre trafic.

Par rapport à Nano Banana Pro. Pro est le modèle supérieur avec des améliorations de fidélité supplémentaires et un conditionnement par image de référence plus fort. Pour les charges de travail où la qualité est l'exigence dominante et le coût est secondaire, Pro est le choix. Pour les charges de travail où la latence et le coût du niveau Flash font partie de l'exigence, Nano Banana 2 atteint un bon équilibre.

Par rapport aux options de génération d'images non-Google. Midjourney conserve sa position sur le photoréalisme et le travail esthétique stylisé. Les variantes haut de gamme de Stable Diffusion rivalisent sur la flexibilité et le déploiement auto-hébergeable. Les modèles d'image OpenAI rivalisent sur l'intégration avec leur stack plus large. Pour les charges de travail sur la stack Google où le rendu de texte dans les images et le conditionnement par image de référence comptent, Nano Banana 2 est parmi les options les plus solides.

Modèles pratiques

Quelques éléments à connaître avant de construire sur Nano Banana 2 :

La structure du prompt compte toujours. Les améliorations par rapport à l'original rendent les prompts plus tolérants, mais des instructions compositionnelles spécifiques produisent toujours une meilleure sortie que des descriptions vagues.
Les images de référence ont un poids significatif. Pour la cohérence des personnages, le transfert de style ou des conseils compositionnels spécifiques, incluez une référence plutôt que de la décrire uniquement en texte.
La latence de génération est raisonnable pour le niveau Flash. Planifiez des modèles UX qui montrent la progression et permettent l'itération plutôt que de bloquer sur une seule génération.
La fenêtre de prompt doublée invite à des prompts plus complexes. Utilisez-la — des prompts plus longs et plus spécifiques produisent une sortie plus contrôlée.
L'itération reste partie du flux de travail. Même les prompts robustes nécessitent souvent deux ou trois générations pour aboutir à la meilleure sortie.

Notes de déploiement

API Google Gemini standard pour les endpoints de génération d'images. Le format de requête suit le même modèle que le Nano Banana original avec l'espace de paramètres supplémentaire pour la fenêtre de contexte plus grande.

La disponibilité régionale suit le modèle standard Vertex AI de Google. Les régions de l'UE sont disponibles sur contrats d'entreprise. L'accès API consommateur prêt à l'emploi ne fixe pas de région.

Le filtrage de sécurité est appliqué aux images générées. Le comportement du filtre est cohérent avec les politiques de contenu plus larges de Google. Les charges de travail avec des besoins légitimes en dehors de ces politiques auront besoin d'un fournisseur totalement différent.

Les images générées comportent un filigrane et des métadonnées de provenance conformément aux engagements de Google concernant le contenu généré par IA. Pour les charges de travail où cela compte d'une manière ou d'une autre, vérifiez la documentation API actuelle pour ce qui est et n'est pas configurable.

Les considérations de niveau aperçu s'appliquent. Les limites de débit, la disponibilité régionale et les comportements spécifiques peuvent évoluer avant la disponibilité générale. Pour les charges de travail de production qui nécessitent un comportement stable, le Nano Banana original reste le choix le plus conservateur pour le moment.

Le choisir

Optez pour Nano Banana 2 quand :

Vous avez besoin du rendu de texte amélioré, de détails plus fins ou d'une fenêtre de prompt plus grande par rapport au Nano Banana original.
La charge de travail concerne des maquettes d'interface utilisateur, du matériel marketing ou du storyboarding où la qualité compte.
Vous êtes prêt à accepter les limites de débit et les considérations de comportement au niveau aperçu.
Vous êtes déjà sur la stack Google et souhaitez y rester.

Choisissez autre chose quand :

Le Nano Banana original couvre votre charge de travail et la mise à niveau au niveau aperçu ajoute du risque sans valeur.
Vous avez besoin d'une fidélité de premier ordre pour le portrait ou le travail artistique stylisé.
Le travail concerne la génération vidéo plutôt que des images fixes.
La génération d'images auto-hébergée ou affinée fait partie de l'exigence.

Le résumé. Chemin de mise à niveau solide depuis le Nano Banana original avec des améliorations significatives sur le rendu de texte, les détails fins et le contrôle de prompt. Pour les charges de travail au niveau aperçu où les améliorations justifient le coût de migration, c'est le bon choix. Pour les charges de travail de production où la stabilité compte plus que la mise à niveau, l'original reste un choix raisonnable.

Testez-le sur un prompt réel sur /live-test. La sortie de génération d'images est suffisamment subjective pour que vous devriez la voir sur votre propre cas d'usage avant de vous engager.

Dernière revue technique : 2026-05-22 — Tokonomix.ai

Dernier test automatisé

21 juin 2026 · 04:49 UTC · Benchmark

Latence P50

4330 ms

Latence P95

—

Erreurs

0 / 6 exécutions

Dernière revue par Équipe Tokonomix·26 mai 2026