Nano-Banana, le modèle de retouche d'images signé Google qui fait fureur

Google pourrait bien rattraper OpenAI avec son nouveau modèle d'édition d'images intégré nativement dans Gemini. Disponible à un prix dérisoire et avec pour ligne directrice de rester fidèle aux détails des personnes présentes dans les images, cette version a d'ores et déjà fait ses preuves après être arrivée première du classement de LMArena.

Exemples modèle Nano-banana - Google
Exemples modèle Nano-banana - Google

Les équipes de Google DeepMind ont réussi à s'emparer de la place du podium du benchmark d'édition d'images LMArena. Son modèle gemini-2.5-flash-image-preview, également appelé Nano-banana, est considéré comme le mieux noté au monde alors qu'il vient à peine de sortir. Intégré à l'application Gemini, il s'attache, lors de la modification de photos de personnes, à garder tous les détails et à rester fidèle à l'image originale.

Avec l'outil, les utilisateurs peuvent demander à changer n'importe quoi, combiner plusieurs photos, ajouter des éléments, etc. Et pour ceux qui souhaitent basculer vers la vidéo, il suffit de télécharger l'image modifiée dans Gemini pour la transformer en une animation. Pour l'heure, Nano-banana est disponible pour tous, utilisateurs gratuits comme payants, dans le monde entier, à partir de l'application Gemini. Il est également disponible via l'API Gemini et dans Google AI Studio pour les développeurs ainsi que dans Vertex AI pour les entreprises.

La firme précise que toutes les images créées ou modifiées dans l’application Gemini comportent un filigrane visible, ainsi qu'un filigrane numérique invisible SynthID, pour indiquer clairement qu’elles sont générées par l'intelligence artificielle.

La concurrence monte d'un cran

En proposant un tel niveau d'édition, le message est clair : Google souhaite s'accaparer une partie du marché occupé jusqu'alors par OpenAI. Ce dernier, en intégrant progressivement DALL-E dans ChatGPT, a réussi à toucher un public plus large. Les chiffres parlent d'eux-mêmes : plus de 130 millions d'utilisateurs ont généré plus de 700 millions d'images depuis le lancement du générateur d'images amélioré dans ChatGPT, le 25 mars dernier.

Pourtant, Google pourrait bien le dépasser. En misant sur le sens du détail de son outil, il touche à un point sensible de l'outil d'OpenAI. Lorsque l'on demande à ce dernier de modifier une image, l'arrière-plan ou de changer un élément, le visage, et plus particulièrement les traits d'une personne ont tendance à être également modifiés sans que l'on ait rien demandé. Même chose pour Grok, le chatbot de xAI.

De son côté, Meta, qui semble dans une position difficile en la matière, a choisi de s'offrir les services de Midjourney pour améliorer ses produits de génération et d'édition d'images. Enfin, ultime argument s'il en fallait un, quand on sait qu'une image générée à partir des outils d'OpenAI coûte 0,19 dollars, l'option Google à 0,039 dollars s'avère une option plus qu'intéressante.

Newsletter L'Usine Digitale
Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.