Носима интелигентна камера разбира тихи гласови команди

Били ли сте в ситуация, в която ръцете ви не са свободни, но не можете да говорите на глас Сири гласов асистент ли? Може да се появи камера, която разбира гласовите ви команди, дори ако не издавате звук.

Двама изследователи от университета Корнел създадоха инфрачервена интелигентна камера за носене, която открива гласови команди не чрез звук, а чрез измерване на движенията на шията и лицето под брадичката.

Интелигентна камера за носене с безшумно разпознаване на говор

Двамата изследователи нарекоха носимата камера „SpeeChin“. Те са Ченг Джанг, асистент по информационни науки в Cornell Ann S. Колеж по компютърни и информационни науки Бауърс и докторантът от Корнел Руйдонг Джанг.

Те казаха, че това е първото устройство за тихо разпознаване на говор, базирано на огърлица, което може да открие 54 команди за тиха реч на английски и 44 на китайски.

„Представете си, когато ръцете ви са заети или просто не искате да достигате до интелигентните си устройства, за да взаимодействате с тях, може да искате да използвате гласов контрол“, каза доцент Джанг. „Ако обаче сте на шумно място или на среща, гласовият контрол не е ефективен или социално подходящ. Тук идва мълчаливата реч.”

Инфрачервената камера на SpeeChin, монтирана на врата, улавя движението на брадичката отдолу. Дори и без звук, това му позволява да определя изречените думи.

Въпреки че се носи по-фино около врата, отколкото при монтирано напред, близо до лицето на високоговорителя, камерата не трябва да предизвиква притеснения за поверителността, защото седи под ъгъл, при който не може да улови други хора лица.

Висока надеждност, но само при определени условия

Gizmodoдокладвано че изследователите са тествали SpeeChin с 20 участници. Десет изговориха 54 прости фрази, включително цифри и общи команди за гласов асистент, на английски. Останалите 10 говореха 44 прости думи и фрази на китайски мандарин. След като беше „обучена“, камерата можеше да разпознава команди на английски с 90,5% точност и на китайски с 91,6% точност.

Но камерата получи тези високи оценки само когато участниците стояха неподвижно. Когато се движеха, надеждността на разпознаването падаше с вариациите в походката и движението на главата.

Това изглежда намалява броя на местата, където може надеждно да се използва устройството SpeeChin. Тоест, освен ако не се направят подобрения, като по-дълги тренировки, включващи движение или, може би, по-модерно оборудване за камера с по-висока разделителна способност и по-висока честота на кадрите за по-детайлно откриване.

Последна публикация в блога

Slack е най -доброто приложение за съобщения за екипи [Cult of Essential iOS Apps на Mac #45]
August 20, 2021

Имейлът може да бъде общо препятствие в производителността. Следването на разговори между множество участници става объркващо. Нещастният резултат...

| Култът към Mac
August 20, 2021

Вземете Apple Watch Series 5 с отстъпка от $ 50Не плащайте пълна цена, когато можете да получите голяма отстъпка.Снимка: AppleМоже да искате да изб...

| Култът към Mac
August 20, 2021

Не е тайна, че опитът на RIM да създаде iPad-убиец с таблета си PlayBook не доведе до успех. В ход, който беше обичайно за миналогодишния парад на ...