Гласовите търсения в Google току -що станаха по -бързи и по -точни, благодарение на новите акустични модели, които осигуряват по -добро разпознаване на гласа, особено в шумна среда.
„Новите акустични модели сега се използват за гласови търсения и команди в приложението Google (за Android и iOS) и за диктовка на устройства с Android “, пише екипът на Google за реч в блога на Google Research днес. „Освен че изискват много по -ниски изчислителни ресурси, новите модели са по -точни, стабилни на шум и по -бърз отговор на заявки за гласово търсене - затова опитайте и бъдете щастливи (глас) търсене! ”
В нашите бързи тестове за Android и Google на Google iOS приложения, производителността е забележимо по -бърза - и поне толкова точна, както винаги. Актуализираното приложение на Google е много по -бързо и обикновено връща много по -полезни резултати от Siri на Apple.
Гласовото разпознаване направи удивителни скокове през последното десетилетие и ще нарасне само значението, тъй като все повече и повече смартфони и свързани устройства добавят непрекъсната функционалност. Тъй като виртуалните асистенти, задвижвани от глас, стават все по-добри в изслушването, разбирането и дори предвиждането на нашите искания, те ще станат все по-дълбоко вплетени в ежедневието ни.
Докато Siri може да е най -разпознаваемият AI помощник наоколо, Телефони с Android и невероятното Amazon Echo са водещи с типа на винаги включената функционалност, която едва сега идва в телефоните на Apple с iPhone 6s.
Детайлите зад актуализираните акустични модели на Google са доста дълбоки за всеки без диплома по компютърни науки. Търсещата компания използва дълбоки невронни мрежи от 2012 г. и се използва свързваща времева класификация и последователно дискриминационно обучение за създаване на новите акустични модели, според публикацията в блога на Google.
Можете да вземете задълбочете се в науката на сайта на Google, или гледайте как машина се научава да произнася изречение във видеоклипа по -долу, но изводът е, че новата акустика моделите са по -точни, особено в типа на шумна среда, която може да направи гласовото разпознаване най -вече безполезен.
Ако не сте опитвали приложенията на Google за търсене или диктовка, опитайте ги сега. Те са лесни за използване и дори по -невероятни от всякога. И когато Google Now on Tap носи още по -дълбоко контекстуално осъзнаване по -късно тази година, можете да очаквате още по -голям скок.