L'Université de Cornell a récemment dévoilé un concept innovant de lunettes capables de lire et de détecter les mouvements de la bouche. Cette avancée technologique est le fruit du travail acharné de Ruidong Zhang, chercheur à l'Université de Cornell. L'objectif principal de ces lunettes est de permettre aux utilisateurs de contrôler leur smartphone sans avoir à toucher l'écran.
La paire de lunettes est équipée de microphones et de haut-parleurs minuscules qui permettent de détecter les mots que l'utilisateur prononce silencieusement. Les chercheurs ont baptisé cette interface EchoSpeech. Elle utilise la détection acoustique et l'intelligence artificielle pour reconnaître jusqu'à 31 commandes non vocales basées sur les mouvements des lèvres et de la bouche. Selon les chercheurs, le système ne nécessite que quelques minutes pour apprendre à reconnaître les schémas de parole de l'utilisateur.
L'un des avantages de cette technologie est qu'elle permet de traiter les données localement sur le smartphone, sans avoir à les télécharger sur le cloud. Cette caractéristique représente une avancée significative en matière de confidentialité. De plus, cette technologie élimine le besoin de porter une caméra, ce qui permet de rester plus discret.
Le potentiel de cette technologie va bien au-delà de la question de la confidentialité. En effet, les chercheurs considèrent que cette technologie pourrait également aider les personnes souffrant de troubles de la parole. Elle pourrait constituer une excellente entrée pour un synthétiseur vocal, offrant ainsi la possibilité de redonner la parole aux patients qui ne peuvent pas vocaliser le son.
Le laboratoire d'interfaces informatiques intelligentes pour interactions futures (SciFi) de l'Université de Cornell explore actuellement la possibilité de commercialiser la technologie derrière EchoSpeech à l'aide d'un programme de financement de Cornell. Des applications permettant de suivre les mouvements du visage, des yeux et du haut du corps sont également à l'étude.
Cette nouvelle technologie représente une avancée significative dans le domaine de la reconnaissance vocale silencieuse. Les chercheurs de l'Université de Cornell ont travaillé dur pour développer cette technologie, qui pourrait changer la vie de nombreuses personnes. En plus de sa portée technologique, elle pourrait également avoir un impact positif sur la vie privée et la confidentialité des utilisateurs. Nous sommes impatients de voir comment cette technologie va évoluer dans les années à venir.