Camera inteligentă purtabilă înțelege comenzile vocale silențioase

Ai fost vreodată într-o situație în care mâinile tale nu sunt libere, dar nu poți vorbi cu voce tare Siri Asistent vocal, de asemenea? Ar putea veni o cameră care să vă înțeleagă comenzile vocale chiar dacă nu scoateți niciun sunet.

Doi cercetători de la Universitatea Cornell au creat o cameră inteligentă cu infraroșu purtabilă care detectează comenzile vocale nu prin sunet, ci prin măsurarea mișcărilor gâtului și feței de sub bărbie.

Cameră inteligentă purtabilă cu detectie silențioasă a vorbirii

Cei doi cercetători au numit camera purtabilă „SpeeChin”. Ei sunt Cheng Zhang, profesor asistent de știința informației la Cornell Ann S. Colegiul Bowers de Informatică și Știința Informației și Ruidong Zhang, doctorand la Cornell.

Ei au spus că este primul dispozitiv de recunoaștere silențioasă a vorbirii bazat pe colier care poate detecta 54 de comenzi vocale silențioase în engleză și 44 în chineză.

„Imaginați-vă când mâinile sunt ocupate sau pur și simplu nu doriți să vă adresați dispozitivelor inteligente pentru a interacționa cu ele, poate doriți să utilizați controlul vocal”, a spus profesorul asistent Zhang. „Cu toate acestea, dacă vă aflați într-un loc zgomotos sau într-o întâlnire, controlul vocal nu este eficient sau adecvat din punct de vedere social. Aici intervine vorbirea tăcută.”

Camera cu infraroșu a lui SpeeChin, montată pe gât, surprinde mișcarea bărbiei de jos. Chiar și fără sunet audibil, acesta îi permite să determine cuvintele rostite.

Deși este mai subtil purtat în jurul gâtului decât într-o poziție montată în față, lângă fața difuzorului, camera nu ar trebui să trezească îngrijorări legate de confidențialitate, deoarece se așează într-un unghi în care nu poate surprinde pe cel al altor persoane chipuri.

Fiabilitate ridicată, dar numai în anumite condiții

Gizmodoraportat că cercetătorii au testat SpeeChin cu 20 de participanți. Ten au rostit 54 de fraze simple, inclusiv numere și comenzi comune ale asistentului vocal, în limba engleză. Ceilalți 10 au rostit 44 de cuvinte și expresii simple în chineză mandarină. După ce a fost „antrenată”, camera putea recunoaște comenzile în engleză cu o precizie de 90,5% și în chineză cu o precizie de 91,6%.

Dar camera a obținut acele note mari doar atunci când participanții au stat nemișcați. Când s-au mișcat, fiabilitatea recunoașterii a scăzut odată cu variațiile în mers pe jos și mișcarea capului.

Acest lucru pare să reducă numărul de locuri în care s-ar putea folosi în mod fiabil dispozitivul SpeeChin. Adică, dacă nu se fac îmbunătățiri, cum ar fi sesiuni de antrenament mai lungi care încorporează mișcare sau, poate, echipament de cameră mai avansat, cu rezoluție mai mare și rate de cadre mai mari pentru o detectare mai detaliată.

Ultima postare pe blog

| Cultul lui Mac
August 21, 2021

CEO-ul Apple, Tim Cook și președintele Donald Trump, vor face tururi prin facilități în Austin, Texas, unde compania își realizează desktop-urile M...

| Cultul lui Mac
August 21, 2021

RIM se pregătește să pună un alt ou putred pentru a provoca iPhone 5Cloaca bolnavă a lui RIM se umflă și se pregătește să scoată un alt BlackBerry....

| Cultul lui Mac
September 10, 2021

Protejați-vă confidențialitatea și securitatea online cu un VPN puternic și accesibilAcest VPN apreciat de critici folosește criptare dublă pentru ...