La fenêtre de 131 000 tokens est-elle suffisante pour des projets professionnels ?

Oui, elle couvre la plupart des besoins professionnels incluant l analyse de rapports longs ou de bases de code modérées.

Ce modèle est-il disponible via Google Cloud ?

Oui, il est accessible via l infrastructure Google AI Platform et les APIs associées.

Quand préférer ce modèle aux variantes Flash ?

Quand vous avez besoin d un équilibre légèrement supérieur entre capacité et performance par rapport aux variantes les plus légères.

Gère-t-il plusieurs langues ?

Oui, comme l ensemble de la famille Gemini il supporte plusieurs langues pour les tâches de génération textuelle.

Tier A — Frontier

Fonctionne en :USCréé en :United States

Google Gemini

Nano Banana Pro

Tier A — Frontier · 131K tokens

Équipe éditoriale Tokonomix·Relu par Mes Kalkan·Publié le 22 mai 2026·Dernière relecture 26 mai 2026

Nano Banana Pro est un modèle de génération de texte développé par Google dans le cadre de la famille Gemini. Il est conçu pour des tâches standards de traitement du langage naturel, notamment la génération de contenu, les réponses aux questions, la synthèse et les applications conversationnelles générales. Le modèle fonctionne avec une fenêtre de contexte de 131K tokens, lui permettant de traiter des documents de longueur modérée et de maintenir des fils de conversation étendus. D'un point de vue technique, Nano Banana Pro représente une offre de milieu de gamme au sein de la gamme de modèles de Google. La fenêtre de contexte de 131K le situe au-dessus des modèles à contexte plus restreint, tout en restant en deçà des capacités de contexte étendu des offres phares de Google. Il est conçu pour gérer des charges de travail typiques de génération de texte ne nécessitant pas de raisonnement approfondi sur des documents très longs, ce qui le rend adapté à des applications telles que les chatbots, l'assistance à la rédaction, les outils éducatifs et les tâches de traitement de texte à usage général. Au sein de l'écosystème Google Gemini, Nano Banana Pro occupe une position pragmatique pour les développeurs cherchant des capacités fiables de génération de texte sans avoir besoin des fonctionnalités multimodales les plus avancées ni de contextes étendus. Le modèle équilibre performance fonctionnelle et accessibilité, en ciblant les cas d'usage où la compréhension et la génération de langage standard constituent les exigences principales. Il convient aux environnements de production où la constance de la qualité du texte produit prime sur les fonctionnalités expérimentales de pointe.

Ce modèle mid-tier Google Gemini offre une fenêtre de contexte de 131 000 tokens pour des usages professionnels équilibrés.
— Synthèse benchmark Tokonomix

Section 01

Historique des tarifs

Tarifs directs du fournisseur par million de tokens, plus une estimation du coût d'une conversation typique.

💰

Tarifs API — Nano Banana Pro

$2.00 par 1M de tokens d'entrée

$12.00 par 1M de tokens de sortie

≈ $0.0036 par conversation typique (800 tokens)

Prix entrée vs sortie (par 1M de tokens)

par 1M de tokens d'entrée$2.00

par 1M de tokens de sortie$12.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$2.00

input / 1M

— stable

$12.00

output / 1M

— stable

2026-05-242026-06-212026-07-26

Input

Output

Price change

⟳ synced weekly

Section 02

Forces & faiblesses

Basé sur les résultats de benchmarks et les retours communautaires agrégés sur des cas d'usage réels.

Forces

Fenêtre de 131 000 tokensCréation de contenu efficaceDialogue conversationnel fluideTraitement de documents modérément longsIntégration Google Cloud aisée

Faiblesses

Capacités inférieures aux modèles flagshipRaisonnement avancé limitéPas de multimodalité avancéeDocumentation publique restreinte

Section 03

Capacités

source: litellmvisionjson modejson schemaimage editingprompt cachingimage generationoutputTokenLimit: 32768max output tokens: 32768

Section 04

Questions fréquentes

Les chatbots, outils d assistance à la rédaction, analyse de documents moyens et applications éducatives.

Un modèle pratique dans l écosystème Gemini pour les équipes cherchant performance sans surcoût.
— Synthèse benchmark Tokonomix

Section 05

Disponibilité

Pas encore de données

Nous n'avons pas encore enregistré suffisamment d'appels API pour afficher les statistiques de disponibilité de ce modèle. Les données apparaîtront dès que le modèle reçoit du trafic en direct.

Section 06

Verdicts benchmark Tokonomix

⚖️

Endorsed by 1 judge

Independent LLM judges evaluated this model on our weekly intelligence tests

claude-sonnet-4-541/100 · 76 runs

25 correct2 partial49 wrong33% accuracy

● 2026-07-26

No performance data available for new benchmark window

The current benchmark window shows no performance results for Nano Banana Pro, making it impossible to assess changes from the previous period. The model previously demonstrated stable performance across various tasks after expanding its feature set to include vision, JSON handling, image editing, prompt caching, and image generation capabilities. Without current benchmark data, users cannot determine whether the model maintains its previous performance levels or if any regressions or improvements have occurred. The absence of results could indicate testing issues, model availability problems, or a gap in the benchmark collection process. Users relying on Nano Banana Pro should be aware that performance verification for this window is unavailable. Until new benchmark data becomes available, the most recent reference point remains the previous window's results, which showed consistent performance across supported capabilities. Organizations using this model in production should monitor their own performance metrics closely during this period of benchmark data absence.

Quality

—

Latency p50

—

Test runs

✗ No benchmark data available

Section 07

Profil complet du modèle

Nano Banana Pro : le générateur d'images phare de Google, en préversion

Nano Banana Pro occupe le sommet de la gamme de génération d'images de Google. Derrière ce nom accessible au grand public se trouve gemini-3-pro-image-preview, un modèle en phase de préversion qui produit des images fixes à partir d'invites textuelles et qui, dans le même appel, peut éditer ou étendre les images que vous lui fournissez. Il s'agit de la troisième version de la lignée Nano Banana, après l'original (construit sur Gemini 2.5 Flash Image) et Nano Banana 2 (sur la préversion 3.1 Flash). La branche « Pro » est ce que Google positionne face au gpt-image-2 d'OpenAI et à l'ensemble du marché des générateurs commerciaux payants.

Cette page concerne la version de préversion. Les capacités et la tarification évoluent toutes deux durant la préversion ; considérez tout ce qui suit comme un instantané.

Ce dans quoi il excelle

Trois domaines se distinguent lors des tests pratiques.

Rendu photoréaliste sans l'aspect plastique. Les premières versions de Nano Banana avaient un style maison reconnaissable : peau légèrement cireuse, couleurs sursaturées, ce lustre caractéristique « rendu par IA » sur les surfaces métalliques. La version Pro réduit considérablement tout cela. Les portraits ressemblent à des photographies plutôt qu'à de la CGI bien plus souvent. Le modèle présente encore des indices révélateurs si vous regardez de près, mais l'écart avec un photographe soigneux équipé d'une softbox s'est rétréci d'une manière que la version précédente n'avait pas réussi à accomplir.

Édition d'images existantes. Fournissez-lui une photographie accompagnée d'une invite comme « supprimer la personne à gauche, étendre l'arrière-plan, conserver l'éclairage » et il effectue le travail en une seule passe. L'inpainting et l'outpainting ne sont pas des points de terminaison distincts ; il s'agit du même appel avec une image jointe. C'est ici que Nano Banana Pro prend clairement de l'avance sur les générateurs à prise unique qui doivent passer par une interface utilisateur d'édition de masques dans un processus aller-retour.

Texte à l'intérieur des images. Une faiblesse de longue date des modèles de diffusion, les lettres incohérentes sur les enseignes et les logos déformés, est sensiblement améliorée ici. Les slogans courts, les étiquettes de produits et les titres de graphiques s'affichent correctement la plupart du temps. Les longs paragraphes de texte se dégradent encore. Si vous avez besoin d'un corps de texte précis à l'intérieur d'une image, vous devez toujours le composer par la suite.

Ce qu'il ne fait pas

Nano Banana Pro est un générateur d'images. Il ne produit pas de vidéo. Il ne génère pas d'audio. Le nombre de 131 072 jetons de contexte que vous pourriez voir dans les tableaux de spécifications fait référence à la quantité de texte que le modèle acceptera dans une seule invite. C'est utile lorsque vous collez un guide de style de marque détaillé ; ce n'est pas utile pour lui fournir un document de 200 pages.

C'est également un générateur, pas un copieur parfait. La reproduction de marques, les portraits de ressemblance exacte de personnes réelles et les logos de marques déposées se situent tous à l'intérieur des garde-fous de sécurité et de politique que Google a établis pour la préversion. Certains de ces garde-fous s'assoupliront lors de la disponibilité générale ; d'autres non. Si votre flux de travail dépend de la reproduction d'un visage spécifique ou d'un logo spécifique avec une fidélité au niveau du pixel, la réponse est un outil différent — généralement un modèle que vous affinez vous-même sur l'actif en question.

Sortie, résolution, latence

Le modèle produit des images selon plusieurs rapports d'aspect prédéfinis : carré, portrait 9:16, paysage 16:9, plus quelques-uns intermédiaires. La résolution de sortie dépend du rapport que vous choisissez, mais le maximum pratique se situe au niveau supérieur de ce que vous utiliseriez pour une image principale sur un site web sans agrandissement. Pour l'impression au format A3 ou supérieur, vous souhaitez toujours une passe d'agrandissement dédiée après la génération.

Le temps de génération par image s'exécute en quelques secondes pour une invite standard avec les paramètres par défaut. Les invites complexes avec des images de référence jointes, ou les opérations d'édition sur une entrée haute résolution, peuvent atteindre dix ou quinze secondes. Par rapport à la génération Nano Banana précédente, ce n'est pas sensiblement plus rapide, mais c'est plus cohérent : vous observez moins de variance entre un appel rapide et un appel lent malchanceux.

Pour une comparaison équitable de la vitesse de génération entre les modèles d'images, les tests continus sur /benchmarks/speed constituent une meilleure source que les fiches techniques.

Style d'invite

Nano Banana Pro répond bien aux invites en langage naturel. Vous n'avez pas besoin de la pile de mots-clés séparés par des virgules que les modèles de diffusion de l'ère SD-1.5 exigeaient. Une phrase ou deux décrivant la scène, l'éclairage, la caméra et l'ambiance suffit généralement.

Il accepte également les directives négatives en anglais simple. « Pas de personnes en arrière-plan. » « Lumière du jour, pas coucher de soleil. » « Photographique, pas illustré. » Ces formulations fonctionnent aussi bien que les indicateurs de paramètres. Cela le rend accessible aux utilisateurs non techniques ; les équipes marketing briefent le modèle comme elles brieferaient un designer junior. Cela peut également frustrer les ingénieurs d'invites qui souhaitent un contrôle à grain fin. Il n'existe pas encore d'équivalent aux poids d'invite négative finement ajustés sur lesquels s'appuient les utilisateurs avancés dans les versions open-weight de diffusion.

Pour comparer comment différents modèles d'images gèrent la même instruction, la page /usecases/content est le bon point de départ.

Où il s'inscrit, où il ne s'inscrit pas

Choisissez Nano Banana Pro quand vous voulez :

Des visuels marketing, des vignettes sociales et des créations publicitaires avec un aspect photographique.
Des modifications rapides d'images existantes : supprimer un objet, étendre un arrière-plan, changer une saison.
Des variations de prises de vue de produits à partir d'une seule photo de référence.
Des images de style de vie pour des articles de blog et des pages de destination où la photographie de stock serait l'alternative évidente.

Choisissez autre chose quand vous avez besoin de :

Reproduction parfaite au pixel près d'actifs de marque. Entraînez un modèle affiné sur votre propre bibliothèque d'actifs.
Garanties strictes d'utilisation commerciale sur chaque sortie durant la préversion. Lisez attentivement les conditions actuelles de Google avant de diffuser une sortie de préversion dans des canaux destinés aux clients.
Génération sur appareil ou entièrement hors ligne. Nano Banana Pro est uniquement par API. Pour les pipelines créatifs locaux d'abord, l'aperçu /usecases/local répertorie les options open-weight plus petites qui méritent d'être connues.
Texte long rendu à l'intérieur de l'image. Composez.

Face aux alternatives évidentes

La décision se résume généralement à trois familles : ce niveau Pro, le gpt-image-2 d'OpenAI, et les niveaux rapides plus petits (Nano Banana 2 sur la préversion 3.1 Flash, et gpt-image-1-mini).

Le niveau Pro l'emporte sur les portraits photoréalistes et sur la qualité du mode édition. Le gpt-image-2 d'OpenAI l'emporte sur certains travaux d'illustration stylisée et sur l'adhérence aux invites lorsque l'invite est inhabituelle ou paradoxale. Les niveaux rapides plus petits l'emportent sur le coût et sur la latence lorsque vous générez des dizaines de variations pour en choisir une. Aucune de ces options n'est décisive. Exécutez les mêmes cinq invites à travers les trois avant d'engager votre équipe sur l'une d'entre elles.

La répartition complète des catégories tourne mensuellement sur /benchmarks/leaderboard.

Deux notes pratiques avant de commencer

Premièrement : préversion signifie préversion. Les points de terminaison peuvent changer sans beaucoup d'avertissement, et les sorties que vous générez aujourd'hui peuvent ne pas être reproductibles avec la même invite le mois prochain. Construisez votre pipeline de sorte que changer le modèle soit un changement de configuration unique, pas une refonte.

Deuxièmement : examinez vos sorties. Les modèles d'images produisent encore des artefacts occasionnels : six doigts, oreilles fondues, une chaise avec trois pieds. Pro réduit le taux par rapport à ses prédécesseurs mais ne le ramène pas à zéro. Tout ce qui se présente devant un client devrait d'abord passer par un œil humain.

Essayez-le sur /live-test. En comparaison directe avec les alternatives, sur votre propre invite.

Dernière revue technique : 2026-05-22 — Tokonomix.ai

Dernier test automatisé

21 juin 2026 · 04:51 UTC · Benchmark

Latence P50

11201 ms

Latence P95

—

Erreurs

0 / 6 exécutions

Dernière revue par Équipe Tokonomix·26 mai 2026