Do slova „Hey Siri“ ide viac, ako by ste si mohli myslieť

Do slova „Hey Siri“ ide viac, ako by ste si mohli myslieť

Siri Alexa v hlasovej správe
Mnoho ľudí nemusí vedieť, že ich iPhone má neurónovú sieť, ktorá ich počúva a hovorí „Hey Siri“.
Foto: Apple

Nechať svoj iPhone odpovedať na „Ahoj Siri“ sa zdá byť taká jednoduchá vec, ale v skutočnosti je to dosť komplikované. Rozpoznanie tejto kódovej frázy a osoby, ktorá ju povedala, je pre systém rozpoznávania reči Apple zásadné.

Príspevok v Apple Denník strojového učenia Práve publikovaný dnes popisuje mnohé z výziev, ktoré vývojári prekonali, aby mohli fungovať.

Jednou z komplikácií je, že rozpoznanie „Hey Siri“ sa musí stať na zariadení iPhone alebo iPad. Väčšina rozpoznávania reči Siri sa vykonáva nahraním slov používateľa na vzdialený server, ale to sa začne až potom, čo telefón rozpozná frázu „Hey Siri“. Záväzok spoločnosti Apple v oblasti ochrany osobných údajov bráni iPhone v odosielaní všetkého, čo počuje, na server.

Každý telefón a väčšina tabletov Apple od iPhone 6s má procesor s nízkym výkonom a vždy zapnutý, ktorý nepretržite počúva kľúčové slovo „Hey Siri“. To je všetko, čo tento čip robí. Tento procesor na rozpoznávanie hlasu používa neurónovú sieť, ktorá napodobňuje rozloženie živého mozgu.

The Denník strojového učenia článok je len o „Hej Siri“, pretože všetky ostatné časti Siriho rozpoznávania reči sa vykonávajú na serveroch. To je úplne iný proces. A jedna taká má celý rad problémov. Napriek tomu Apple je o nájme opraviť ich.

Prečo „Ahoj Siri“?

Apple vybral svoju kľúčovú frázu, pretože je krátka a ľahko sa hovorí. Systém rozpoznávania hlasu Siri debutoval na iPhone 4S niekoľko rokov predtým, ale na aktiváciu bolo potrebné stlačiť tlačidlo Domov. Podľa spoločnosti Apple mnoho ľudí začalo so svojimi požiadavkami „Hey Siri“ ešte predtým, ako mala táto fráza svoju úlohu.

Temnejšou stránkou tejto fázy je, že sa podobá mnohým ďalším frázam, ako napríklad „to myslíš vážne?“. Dedikovaný procesor iPhonu sa musí vyrovnať aj so všetkými ostatnými ľuďmi, ktorí chatujú v okolí, z ktorých niektorí môžu hovoriť so svojimi vlastnými telefónmi iPhone.

Podľa dnešného Denník strojového učenia článok, čip najskôr vyberie frázu „Hej Siri“ z toho, čo počuje, a potom skontroluje, či frázu povedal ten, pre koho bol vyškolený.

Procesor zmení zvuk na 13-rozmerný vektor, aby rozpoznal, že niekto povedal „Ahoj Siri“. Potom prevedie zvuk na 442-rozmerový vektor, aby zistil, či kľúčový frázu vyslovil správny reproduktor.

Spoločnosť Apple zverejnila podrobnosti o tom, ako vyberá zo vzduchu najdôležitejšiu frázu vo formáte Denník strojového učenia článok v októbri. Najnovší príspevok pojednáva o tom, ako sa nervový čip učí rozpoznávať svojho majiteľa.

Školenie „Ahoj Siri“

Každý si pamätá, že musel trénovať svoj iPhone, aby rozpoznal svoj vlastný hlas, a to tak, že niekoľkokrát povedal „Hey Siri“. Toto sa nazýva explicitná registrácia.

Málokto si uvedomuje, že systém sa po tréningu naďalej učí, ako znie ich hlas. Je to preto, že relácia sa takmer vždy vykonáva za ideálnych podmienok, zatiaľ čo iPhone sa musí naučiť rozpoznať „Hey Siri“ podľa všetkých druhov okolitého hluku. Nejaký čas po oficiálnom ukončení školenia sa každé použitie slova „Hey Siri“ používa na získanie ďalších informácií.

Skúste teda zabrániť tomu, aby ostatní hovorili „Hej Siri“ blízko vášho iPhone, kým sa stále učí váš hlas.

Záležitosti ochrany osobných údajov

Spoločnosť Apple si stanovila náročnú úlohu, keď sa rozhodla vykonať rozpoznávanie hlasu priamo v smartfóne. Alternatívou však bolo odoslať záznamy o všetkom, čo bolo povedané v blízkosti zariadenia iPhone, na vzdialený server, aby sa rozpoznala kľúčová fráza. Apple nechcel zo svojich zariadení urobiť špiónov.

To Amazonu samozrejme neprekážalo. Presne tak všetky svoje zariadenia Echo rozpoznávajú reč.

Najnovší blogový príspevok

Zmenil Apple svoj algoritmus hodnotenia aplikácií v obchode App Store?
September 11, 2021

Náhle zmeny v rebríčku App Store pre bezplatné aj platené hry a aplikácie viedli k špekuláciám, že Apple zmenil svoj algoritmus hodnotenia App Stor...

Nový herný reproduktor Logitech G560 pre PC prináša svetelnú show na váš počítač
September 11, 2021

Nový reproduktorový systém Logitech dodáva hraniu nový rozmer: farbu. LED diódy ukryté v prednej a zadnej časti reproduktora vo svetle kúpajú vašu ...

Zdrojová bezdrôtová nabíjačka naznačuje, že problémy s AirPowers sú riešiteľné
September 11, 2021

Na AirPower sme čakali dva roky a nakoniec Apple nemohol dodať. Mnoho technických problémov prinútilo Apple urobiť niečo, čo robí len zriedka - vzd...