Apple avslører AI -magi bak 'Hey Siri'

En liten hjelpeprosessor med lav effekt som stadig lytter etter uttrykket "Hey Siri" muliggjør en av de mest grunnleggende funksjonene i Apples AI-assistent.

Prosessoren, innebygd i iPhones bevegelsesprosessor, holder "Hey Siri" -kommandoen fra å kjøre på enhetens hovedprosessor hele dagen. Denne åpenbaringen kommer i et forskningsoppslag publisert i dag av Apples maskinlæringsteam. Papiret dykker dypt ned i hvordan Apple bruker AI til å drive "Hey Siri."

Siri, AI -assistenten som inntar en stadig mer fremtredende plass i Apples økosystem, debuterte i 2011 på iPhone 4s. I dag jobber Siri på Mac, iPads, HomePods og mer. Det lar brukerne raskt utføre rutinemessige oppgaver og få svar på vanlige spørsmål.

Imidlertid, mens Siri fortsetter å forbedre, funksjonen trenger fortsatt arbeid. Og Apple møter økende konkurranse fra smartere tjenester som Google Assistant.

Apples datavitenskapere fortsetter å koble til, noe som gjør Siri smartere og mer nyttig hele tiden. I papir publisert på bloggen sin

i dag diskuterer Apple hvordan den fant unike måter å bruke maskinlæring for å forhindre falske utløsere av "Hey Siri" -kommandoen.

Hvordan 'Hei Siri' fungerer

Arbeidsflyten bak Hey Siri
Arbeidsflyten bak "Hei Siri."
Foto: Apple

Å oppdage når noen faktisk vil utløse Siri, viser seg å være mer komplisert enn du kanskje forventer. For å trekke den ut, konverterer Apple stemmen din ved hjelp av et Deep Neural Network til en sannsynlighetsfordeling over talelyder. Det, i sin tur, genererer en selvtillit score. Hvis den er høy nok, våkner Siri.

Apple bruker også en score med lavere terskel. Hvis konfidenspoengene oppfyller det, men ikke overskrider den øvre terskelen, går iPhone -prosessoren over i en mer sensitiv tilstand i noen sekunder. Det betyr at det kan aktivere Siri raskere hvis du gjentar kommandoen.

Gjør Siri mer nøyaktig

For å øke Siri-nøyaktigheten ytterligere, opprettet Apple språkspesifikke fonetiske spesifikasjoner for "Hey Siri" -frasen for modellen. På engelsk bruker selskapet to varianter. I den ene høres den første vokalen i "Siri" ut som "alvorlig". I den andre høres det ut som “Syria”.

Hvis du er interessert i maskinlæring og vil vite om hvordan Cupertino bruker det i talegjenkjenning, gi Apples fulle papir en lesning.

Siste blogginnlegg

| Cult of Mac
September 11, 2021

'Twas the Night Before Christmas at Apple Park... [Et festlig dikt]Festlig jubel selges separat.Foto: Luke Dormeh/Cult of Mac'Var natten før jul, o...

| Cult of Mac
September 11, 2021

Legg denne søte U2-inspirerte iPod-leken til spillelisten dinDenne iBoy er rød og svart for å ligne U2 spesialutgave iPod.Foto: Philip LeeAv alle A...

Woz: Android -telefoner er feil som Lisa eller Apple III
September 11, 2021

Woz: Android -telefoner er feil som Lisa eller Apple IIIApples medgründer og den storslåtte kosebjørn Steve Wozniak var i India forrige uke for å s...