La caméra intelligente portable comprend les commandes vocales silencieuses

Vous avez déjà été dans une situation où vos mains ne sont pas libres mais vous ne pouvez pas parler à haute voix Siri assistant vocal non plus? Il pourrait arriver qu'une caméra comprenne vos commandes vocales même si vous n'émettez pas de son.

Deux chercheurs de l'Université Cornell ont créé une caméra intelligente infrarouge portable qui détecte les commandes vocales non pas par le son, mais en mesurant les mouvements du cou et du visage sous le menton.

Caméra intelligente portable avec détection silencieuse de la parole

Les deux chercheurs ont surnommé la caméra portable "SpeeChin". Il s'agit de Cheng Zhang, professeur adjoint de sciences de l'information au Cornell Ann S. Bowers College of Computing and Information Science, et le doctorant de Cornell Ruidong Zhang.

Ils ont déclaré qu'il s'agissait du premier appareil de reconnaissance vocale silencieux basé sur un collier capable de détecter 54 commandes vocales silencieuses en anglais et 44 en chinois.

"Imaginez quand vos mains sont occupées ou que vous ne voulez tout simplement pas tendre la main à vos appareils intelligents pour interagir avec eux, vous voudrez peut-être utiliser la commande vocale", a déclaré le professeur adjoint Zhang. "Cependant, si vous êtes dans un endroit bruyant ou en réunion, la commande vocale n'est pas efficace ou socialement appropriée. C'est là que le discours silencieux entre en place.

La caméra infrarouge SpeeChin montée sur le cou capture le mouvement du menton par le bas. Même sans son audible, cela lui permet de déterminer les mots prononcés.

Bien que plus subtilement porté autour du cou que dans un placement vers l'avant près du visage de l'orateur, le la caméra ne devrait pas susciter de problèmes de confidentialité car elle se trouve à un angle où elle ne peut pas capturer celle des autres visages.

Haute fiabilité, mais seulement sous certaines conditions

Gizmodosignalé que les chercheurs ont testé SpeeChin avec 20 participants. Dix ont prononcé 54 phrases simples, y compris des chiffres et des commandes d'assistant vocal courantes, en anglais. Les 10 autres parlaient 44 mots et phrases simples en chinois mandarin. Après avoir été "formée", la caméra pouvait reconnaître les commandes en anglais avec une précision de 90,5 % et en chinois avec une précision de 91,6 %.

Mais la caméra n'a obtenu ces notes élevées que lorsque les participants se sont assis immobiles. Lorsqu'ils se déplaçaient, la fiabilité de la reconnaissance diminuait avec les variations de la marche et du mouvement de la tête.

Cela semblerait réduire le nombre d'endroits où l'on pourrait utiliser de manière fiable l'appareil SpeeChin. Autrement dit, à moins que des améliorations ne soient apportées, comme des séances d'entraînement plus longues incorporant du mouvement ou, peut-être, un équipement de caméra plus avancé avec une résolution plus élevée et des fréquences d'images plus élevées pour une détection plus détaillée.

Dernier article de blog

Les jeux Nintendo iOS arrivent et nous sommes inquiets
August 20, 2021

Les coques séchées de la tête de série Nintendo bien-aimée pour smartphonesCela ressemble à un Professeur Layton... jeu de cartes? Pouah. Photo: Ni...

| Culte de Mac
August 20, 2021

Les plans de données familiales partagées de Verizon sont à portée de mainNous sommes au courant du plan de Verizon pour introduire des plans de do...

| Culte de Mac
August 20, 2021

Dépannage de votre jailbreak iPhone 4S et iPad 2Le premier jailbreak pour l'iPhone 4S et l'iPad 2 est devenu disponible au public la semaine derniè...