Le laboratoire Google Brain, spécialisé dans le deep learning, vient de présenter ses dernières avancées en matière d’intelligence artificielle : au programme, de la création d’images réalistes à partir de courts textes. Le résultat est troublant, mais aussi potentiellement dangereux.
Baptisé "Imagen", cette nouvelle technologie est capable de produire n’importe quelle photo à partir d’un simple texte écrit. Il suffit donc de renseigner la zone d’entrée avec « la photo d’un chien Corgi pilotant une moto » pour qu’Imagen produise en quelques secondes la photo correspondante à cette description (photo bien sûr créée de toute pièce).
Les chercheurs de Google Brain soutiennent que les résultats obtenus par Imagen ont tendance à davantage convaincre les observateurs que ceux d’autres IA similaires. Des propos qui se basent sur un test monté de toute pièce par les mêmes scientifiques, nommé DrawBench : il regroupe 200 phrases de test qui ont été fournies à trois autres IA en plus d’Imagien : VQ-GAN, LDM et DALL-E 2. Les algorithmes ont généré leurs propres rendus, qui ont ensuite été présentés à des personnes bien humaines, missionnées pour juger de la fidélité de l’image par rapport au texte. Imagen sort vainqueur à chaque fois.
Malheureusement, les chercheurs de Google ne comptent pas proposer Imagen au grand public, en tout cas pas en l’état. La raison évoquée est principalement éthique : l’intelligence artificielle étant vraisemblablement capable de fournir un rendu photoréaliste pour à peu près n’importe quoi, les scientifiques de Google craignent une utilisation pouvant avoir « un impact complexe sur la société ».
