Били ли сте в ситуация, в която ръцете ви не са свободни, но не можете да говорите на глас Сири гласов асистент ли? Може да се появи камера, която разбира гласовите ви команди, дори ако не издавате звук.
Двама изследователи от университета Корнел създадоха инфрачервена интелигентна камера за носене, която открива гласови команди не чрез звук, а чрез измерване на движенията на шията и лицето под брадичката.
Интелигентна камера за носене с безшумно разпознаване на говор
Двамата изследователи нарекоха носимата камера „SpeeChin“. Те са Ченг Джанг, асистент по информационни науки в Cornell Ann S. Колеж по компютърни и информационни науки Бауърс и докторантът от Корнел Руйдонг Джанг.
Те казаха, че това е първото устройство за тихо разпознаване на говор, базирано на огърлица, което може да открие 54 команди за тиха реч на английски и 44 на китайски.
„Представете си, когато ръцете ви са заети или просто не искате да достигате до интелигентните си устройства, за да взаимодействате с тях, може да искате да използвате гласов контрол“, каза доцент Джанг. „Ако обаче сте на шумно място или на среща, гласовият контрол не е ефективен или социално подходящ. Тук идва мълчаливата реч.”
Инфрачервената камера на SpeeChin, монтирана на врата, улавя движението на брадичката отдолу. Дори и без звук, това му позволява да определя изречените думи.
Въпреки че се носи по-фино около врата, отколкото при монтирано напред, близо до лицето на високоговорителя, камерата не трябва да предизвиква притеснения за поверителността, защото седи под ъгъл, при който не може да улови други хора лица.
Висока надеждност, но само при определени условия
Gizmodoдокладвано че изследователите са тествали SpeeChin с 20 участници. Десет изговориха 54 прости фрази, включително цифри и общи команди за гласов асистент, на английски. Останалите 10 говореха 44 прости думи и фрази на китайски мандарин. След като беше „обучена“, камерата можеше да разпознава команди на английски с 90,5% точност и на китайски с 91,6% точност.
Но камерата получи тези високи оценки само когато участниците стояха неподвижно. Когато се движеха, надеждността на разпознаването падаше с вариациите в походката и движението на главата.
Това изглежда намалява броя на местата, където може надеждно да се използва устройството SpeeChin. Тоест, освен ако не се направят подобрения, като по-дълги тренировки, включващи движение или, може би, по-модерно оборудване за камера с по-висока разделителна способност и по-висока честота на кадрите за по-детайлно откриване.