당신이 생각하는 것보다 더 많은 것이 'Siri야'에 들어갑니다.

당신이 생각하는 것보다 더 많은 것이 'Siri야'에 들어갑니다.

음성 보고서의 Siri Alexa
많은 사람들은 iPhone에 "Siri야"라고 말하는 것을 듣는 신경망이 있다는 사실을 모를 수 있습니다.
사진: 애플

iPhone이 "Hey Siri"에 응답하게 하는 것은 그렇게 간단한 것처럼 보이지만 실제로는 상당히 복잡합니다. 이 코드 프레이즈와 그것을 말한 사람을 인식하는 것은 Apple 음성 인식 시스템에 매우 중요합니다.

Apple의 게시물 기계 학습 저널 오늘 발표된 이 문서에서는 개발자가 이 작업을 수행하기 위해 극복한 많은 문제에 대해 설명합니다.

문제 중 하나는 iPhone 또는 iPad에서 "Hey Siri"를 인식해야 한다는 것입니다. 대부분의 Siri의 음성 인식은 사용자의 단어를 원격 서버에 업로드하여 수행되지만, 이는 "Hey Siri" 문구가 전화기에서 인식된 후에만 시작됩니다. 개인 정보 보호에 대한 Apple의 약속은 iPhone이 들리는 모든 정보를 서버로 보내는 것을 방지합니다.

iPhone 6s 이후의 모든 전화와 대부분의 Apple 태블릿에는 "Siri야"라는 핵심 문구를 계속 수신하는 저전력 및 상시 작동 프로세서가 있습니다. 이것이 이 칩이 하는 전부입니다. 이 음성 인식 프로세서는 살아있는 뇌의 레이아웃을 모방한 신경망을 사용합니다.

NS 기계 학습 저널 이 기사는 Siri의 음성 인식의 나머지 부분이 모두 서버에서 수행되기 때문에 "Hey Siri"에 관한 것입니다. 그것은 완전히 다른 과정입니다. 그리고 그 하나 문제가 많다. 그래도 애플은 채용에 그들을 고치기 위해.

왜 "안녕 시리"?

Apple은 짧고 말하기 쉽기 때문에 핵심 문구를 선택했습니다. Siri 음성 인식 시스템은 몇 년 전에 iPhone 4S에서 데뷔했지만 활성화하려면 홈 버튼을 눌러야 했습니다. Apple에 따르면 이 문구가 역할을 하기도 전에 많은 사람들이 "Hey Siri"로 요청을 시작했습니다.

단점은 이 핵심 단계가 "진심입니까?"와 같은 다른 많은 문구와 유사하다는 것입니다. iPhone의 전용 프로세서는 또한 근처에서 수다를 떨고 있는 다른 모든 사람들을 처리해야 합니다. 그들 중 일부는 자신의 iPhone과 대화할 수도 있습니다.

오늘의 말씀에 따르면 기계 학습 저널 기사, 칩은 먼저 들은 것에서 "Hey Siri"라는 문구를 선택한 다음 해당 문구를 듣도록 훈련받은 사람이 말한 것인지 확인합니다.

프로세서는 오디오를 13차원 벡터로 변환하여 누군가가 "Siri야"라고 말한 것을 인식합니다. 그런 다음 오디오를 442차원 벡터로 변환하여 올바른 화자가 핵심 문구를 발화했는지 확인합니다.

Apple은 공중에서 가장 중요한 문구를 선택하는 방법에 대한 세부 정보를 게시했습니다. 기계 학습 저널 10월 기사. 최신 게시물에서는 신경 칩이 소유자를 인식하는 방법을 학습합니다.

"Siri야" 훈련

"Siri야"라고 여러 번 말하여 자신의 목소리를 인식하도록 iPhone을 훈련시켜야 한다는 것은 누구나 기억합니다. 이를 명시적 등록이라고 합니다.

극소수의 사람들이 깨닫는 것은 시스템이 훈련 세션 후에 목소리가 어떻게 들리는지 계속 학습한다는 것입니다. 이는 세션이 거의 항상 이상적인 조건에서 수행되는 반면 iPhone은 모든 종류의 주변 소음과 함께 "Hey Siri"를 인식하는 방법을 배워야 하기 때문입니다. 훈련이 공식적으로 끝난 후 얼마 동안은 "Siri야"를 사용할 때마다 더 많은 것을 배울 수 있습니다.

따라서 iPhone이 여전히 음성을 학습하는 동안 iPhone 근처에서 다른 사람이 "Siri야"라고 말하지 않도록 하십시오.

개인정보 보호 문제

애플은 스마트폰에서 직접 음성인식을 하기로 결정하면서 스스로 어려운 과제를 내놓았다. 그러나 대안은 핵심 문구를 인식하기 위해 iPhone 근처에서 말한 모든 내용을 원격 서버로 녹음하는 것이었습니다. Apple은 기기를 스파이로 만들지 않았습니다.

물론 그것은 아마존을 괴롭히지 않았습니다. 이것이 바로 Echo 장치가 모든 음성 인식을 수행하는 방식입니다.

최신 블로그 게시물

보고서: iOS 사용자의 거의 90%가 iOS 4.0 이상을 실행하고 있습니다.
September 11, 2021

당신은 아마 알고 충돌 앱이 실행되는 동안 다른 사람의 기기와 "충돌"하여 연락처를 교환할 수 있는 iOS 앱 뒤에 있는 사람입니다. Apple이 그들의 아이디어를 훔쳐 iOS에 직접 통합하고 이미 사업을 중단하지 않았다는 것이 너무나 좋은 제품입니다.그러나 Bu...

지금 iOS 5 받기 — 더 이상 등록된 개발자가 아니어도 설치 가능
September 11, 2021

지금 iOS 5 받기 — 더 이상 등록된 개발자가 아니어도 설치 가능어제 애플의 'Let's talk iPhone' 행사 직후, 회사는 드디어 골드 마스터 시드 대망의 iOS 5 소프트웨어 출시. 지금까지는 소프트웨어를 일찍 사용하기 위해 장치의 UDID를 등록해...

Google, iPhone용 'Fantastic' 기본 Gmail 앱 출시 직전'
September 11, 2021

App Store는 아직 타사 이메일 클라이언트를 제공하지 않지만 Google 덕분에 모든 것이 변경될 예정입니다. 회사는 이미 승인을 위해 Apple에 제출되었을 수 있는 iPhone용 "환상적인" Gmail 앱을 출시하기 직전에 있는 것으로 알려졌습니다.Tec...