Носимая смарт-камера понимает тихие голосовые команды

Вы когда-нибудь были в ситуации, когда ваши руки не свободны, но вы не можете говорить вслух Сири голосовой помощник тоже? Может появиться камера, которая понимает ваши голосовые команды, даже если вы не издаете ни звука.

Два исследователя из Корнельского университета создали носимую инфракрасную смарт-камеру, которая распознает голосовые команды не по звуку, а измеряя движения шеи и лица из-под подбородка.

Носимая смарт-камера с бесшумным распознаванием речи

Два исследователя назвали носимую камеру «SpeeChin». Это Ченг Чжан, доцент кафедры информатики в Корнеллском университете Энн С. Колледж компьютерных и информационных наук Бауэрса и докторант Корнелла Руидонг Чжан.

Они заявили, что это первое устройство распознавания немой речи на основе ожерелья, которое может распознавать 54 команды молчаливой речи на английском и 44 на китайском языках.

«Представьте, что когда ваши руки заняты или вы просто не хотите тянуться к своим интеллектуальным устройствам, чтобы взаимодействовать с ними, вы можете использовать голосовое управление», — сказал доцент Чжан. «Однако, если вы находитесь в шумном месте или на совещании, голосовое управление неэффективно или социально неприемлемо. Вот где вступает в действие безмолвная речь».

Инфракрасная камера SpeeChin на шее фиксирует движение подбородка снизу. Даже без слышимого звука это позволяет ему определять произносимые слова.

Несмотря на то, что ношение на шее менее заметно, чем при размещении спереди рядом с лицом говорящего, камера не должна вызывать беспокойства о конфиденциальности, потому что она расположена под углом, при котором она не может захватить чужие лица.

Высокая надежность, но только при определенных условиях

Гизмодосообщил что исследователи протестировали SpeeChin с 20 участниками. Десять произнесли 54 простые фразы, включая числа и общие команды голосового помощника, на английском языке. Остальные 10 произнесли 44 простых слова и фразы на китайском языке. После «обучения» камера могла распознавать команды на английском языке с точностью 90,5% и на китайском языке с точностью 91,6%.

Но камера получала такие высокие оценки только тогда, когда участники сидели неподвижно. Когда они двигались, достоверность распознавания падала при изменении походки и движений головы.

Казалось бы, это уменьшает количество мест, где можно надежно использовать устройство SpeeChin. То есть, если не будут сделаны улучшения, такие как более длительные тренировки, включающие движение или, возможно, более совершенное оборудование камеры с более высоким разрешением и более высокой частотой кадров для более детального обнаружения.

Последнее сообщение в блоге

Новости, аналитика и мнения Apple, а также общие технические новости
August 19, 2021

Ferrari представит CarPlay завтра в ЖеневеЧто на первом месте, iOS или автомобиль? Будет интересно узнать, что больше всего привлекает внимание, ко...

Новости, аналитика и мнения Apple, а также общие технические новости
August 19, 2021

iOS 7 позволит перемещаться между открытыми сетями Wi-Fi без потери ваших данныхБлуждая между общедоступными сетями Wi-Fi и никогда не прерывая раб...

Новости, аналитика и мнения Apple, а также общие технические новости
August 19, 2021

Тот неловкий момент, когда Билл Гейтс обнаруживает, что Джимми Фэллон использует Mac [видео]Вчера вечером Билл Гейтс выскочил на сцену «Поздней ноч...