La guerre des intelligences artificielles génératives s’intensifie, et Google entend bien reprendre l’avantage. L’entreprise vient de présenter Gemini 2.5 Flash Image, une mise à jour axée sur l’édition visuelle, testée en avant-première sous le nom de code « Nano Banana ». Objectif affiché : offrir aux utilisateurs un contrôle plus naturel et plus précis sur la retouche d’images, un domaine où OpenAI et ses intégrations dans ChatGPT avaient jusqu’ici pris une longueur d’avance.
Des retouches plus réalistes et mieux contrôlées
L’un des reproches fréquents aux modèles d’IA concurrents réside dans leur difficulté à gérer les détails sans altérer l’ensemble d’une photo. Modifier la couleur d’un vêtement, retoucher un arrière-plan ou fusionner deux images pouvait souvent donner des résultats incohérents. Google affirme avoir résolu ce problème grâce à une meilleure consistance visuelle, notamment pour les visages, les animaux et les objets complexes.
Avec Gemini 2.5, il devient possible de réaliser des montages élaborés : imaginer une décoration intérieure en mélangeant meubles, palettes de couleurs et ambiances lumineuses, ou encore ajuster des détails sans altérer l’ensemble de la scène. Plus qu’un simple générateur d’images, l’outil veut se positionner comme un assistant créatif fiable.
Une réponse à une concurrence féroce
Cette avancée n’est pas qu’une prouesse technique, elle s’inscrit dans une bataille stratégique. OpenAI séduit actuellement plus de 700 millions d’utilisateurs hebdomadaires grâce à ChatGPT, tandis que Gemini plafonne à environ 450 millions d’utilisateurs mensuels, selon Sundar Pichai. Meta, de son côté, renforce ses services en collaborant avec Midjourney, tandis que des acteurs émergents comme Black Forest Labs imposent leurs modèles FLUX comme nouvelles références.
Dans ce paysage ultra-compétitif, Google ne peut plus se contenter de suivre : il doit convaincre que Gemini est non seulement innovant, mais aussi incontournable.
Un équilibre entre créativité et sécurité
Reste une question sensible : jusqu’où peut aller la créativité permise par cette IA ? Google, échaudé par des polémiques liées à des représentations inexactes dans ses générateurs précédents, mise désormais sur un cadre plus strict. Chaque image générée est marquée par un filigrane invisible et des métadonnées, et la création de contenus explicites non consensuels est interdite.
Si ces garde-fous constituent une avancée, leur efficacité reste à prouver face à la prolifération de faux visuels sur les réseaux sociaux. Mais Google affiche une ambition claire : proposer un outil puissant, polyvalent et sécurisé, capable de séduire aussi bien les créatifs amateurs que les professionnels.
Avec « Nano Banana », Google ne se contente pas de rattraper son retard : il veut imposer une nouvelle référence dans l’édition d’images par intelligence artificielle.
