Голосовой поиск Google стал быстрее и точнее благодаря новым акустическим моделям, которые обеспечивают лучшее распознавание голоса, особенно в шумной обстановке.
«Новые акустические модели теперь используются для голосового поиска и команд в приложении Google (на Android и iOS), а также для диктовки на устройствах Android », - написала команда Google Speech в блоге Google Research. Cегодня. «Помимо того, что новые модели требуют гораздо меньших вычислительных ресурсов, они более точны и надежны. к шуму и быстрее реагировать на запросы голосового поиска - так что попробуйте, и радуйтесь (голос) поиск! »
В наших быстрых тестах на Android от Google и iOS приложений, производительность заметно выше - и, по крайней мере, такая же точная, как и прежде. Обновленное приложение Google работает намного быстрее и обычно дает гораздо более полезные результаты, чем Siri от Apple.
Распознавание голоса совершило поразительный скачок за последнее десятилетие, и его значение будет только расти по мере того, как все больше и больше смартфонов и подключенных устройств добавляют постоянно включенные функции. По мере того, как виртуальные помощники, работающие с помощью голоса, будут лучше слышать, понимать и даже предсказывать наши запросы, они будут все глубже вплетаться в нашу повседневную рутину.
В то время как Siri может быть самым узнаваемым помощником искусственного интеллекта в мире, Телефоны Android и удивительные Amazon Echo лидируют с типом постоянно включенной функциональности, которая только сейчас появляется в телефонах Apple с iPhone 6s.
Детали, лежащие в основе обновленных акустических моделей Google, довольно глубоки для любого, кто не имеет степени в области компьютерных наук. Поисковая компания использовала глубокие нейронные сети с 2012 года и использовал коннекционистская временная классификация а также Последовательное дискриминативное обучение для создания новых акустических моделей, согласно сообщению в блоге Google.
Вы можете взять погрузиться в науку на сайте Google, или посмотрите, как машина учится произносить предложения в видео ниже, но вывод состоит в том, что новая акустическая модели более точны, особенно в шумных средах, которые могут в основном воспроизводить распознавание голоса. бесполезный.
Если вы еще не пробовали приложения Google для поиска или диктовки, попробуйте их сейчас. Они просты в использовании и еще более невероятны, чем когда-либо. И когда Google Now on Tap принесет еще более глубокое понимание контекста в конце этого года, вы можете ожидать еще большего скачка.