Facebook
  • Acceuil
  • News
  • Microsoft présente Kosmos-1, une IA généraliste capable d'analyser des images en plus de comprendre des textes

Microsoft présente Kosmos-1, une IA généraliste capable d'analyser des images en plus de comprendre des textes

title..

Microsoft a présenté une nouvelle IA nommée "Kosmos-1" qui est encore plus polyvalente que son fameux ChatGPT. Elle est capable non seulement de répondre aux questions textuelles, mais elle peut aussi analyser et traiter des images.

Dans un article intitulé « Le langage n’est pas tout ce dont vous avez besoin : aligner la perception et les modèles de langage » (Language Is Not All You Need: Aligning Perception with Language Models), les chercheurs de Microsoft ont présenté Kosmos-1 qui est une IA généraliste. En effet, comme le rappellent les chercheurs dans l'introduction de leur article, « une grande convergence du langage, de la perception multimodale, de l’action et de la modélisation du monde est une étape clé vers l’intelligence artificielle généraliste ».

Microsoft a investi plusieurs milliards de dollars dans OpenAI, le concepteur de ChatGPT, et souhaite intégrer cette invention dans plusieurs de ses logiciels. Cependant, pour atteindre une véritable IA généraliste, il est nécessaire de passer à une analyse multimodale. Cela signifie que l'IA doit être capable d'interpréter des images et leurs contextes, ou bien de comprendre des signaux sonores, tout comme l'être humain qui exploite les cinq sens.

La nouvelle IA présentée par Microsoft est capable de comprendre et de générer du langage, de dialoguer de manière multimodale, de sous-titrer des images, de répondre à des questions visuelles et de réaliser des tâches de vision telles que la classification selon des instructions textuelles. Il a été conçu pour répondre à ces besoins en matière d'IA généraliste.

Enfin, Kosmos-1 marque une étape importante dans le développement de l'IA et de sa capacité à comprendre les données multimodales. Cette IA généraliste a de nombreux domaines d'application potentiels, notamment dans la reconnaissance vocale et la reconnaissance d'images, ce qui pourrait ouvrir la voie à de nouvelles applications de l'IA.

 

Ce site, utilise des cookies afin de vous offrir une bonne expérience de navigation et d’améliorer continuellement nos services. En continuant à naviguer sur ce site, vous acceptez l’utilisation de ces cookies.