ऐप्पल ने 'हे ​​सिरी' के पीछे एआई जादू का खुलासा किया

एक छोटा, कम शक्ति वाला सहायक प्रोसेसर जो लगातार "अरे सिरी" वाक्यांश को सुनता है, ऐप्पल के एआई सहायक की सबसे बुनियादी सुविधाओं में से एक को सक्षम बनाता है।

IPhone के मोशन कोप्रोसेसर में एम्बेडेड प्रोसेसर, "अरे सिरी" कमांड को पूरे दिन डिवाइस के मुख्य प्रोसेसर पर चलने से रोकता है। यह रहस्योद्घाटन आज Apple की मशीन लर्निंग टीम द्वारा प्रकाशित एक शोध पत्र में आया है। पेपर इस बात में गहराई से गोता लगाता है कि Apple "अरे सिरी" को शक्ति देने के लिए AI का उपयोग कैसे करता है।

सिरी, एआई सहायक जो ऐप्पल पारिस्थितिकी तंत्र में तेजी से प्रमुख स्थान रखता है, 2011 में शुरू हुआ आईफोन 4एस पर। आज, Siri Mac, iPads, HomePods आदि पर काम करती है। यह उपयोगकर्ताओं को नियमित कार्यों को जल्दी से करने और सामान्य प्रश्नों के उत्तर प्राप्त करने की अनुमति देता है।

हालाँकि, जबकि सिरी में सुधार जारी है, सुविधा अभी भी काम की जरूरत है. और Apple को से बढ़ती प्रतिस्पर्धा का सामना करना पड़ रहा है Google Assistant जैसी स्मार्ट सेवाएं.

ऐप्पल के डेटा वैज्ञानिक सिरी को हर समय स्मार्ट और अधिक उपयोगी बनाते हुए दूर करते रहते हैं। में अपने ब्लॉग पर प्रकाशित पेपर

आज, Apple चर्चा करता है कि कैसे उसने "अरे सिरी" कमांड के झूठे ट्रिगर को रोकने के लिए मशीन लर्निंग का उपयोग करने के अनूठे तरीके खोजे।

'अरे सिरी' कैसे काम करता है

अरे सिरी के पीछे का कार्यप्रवाह
"अरे सिरी" के पीछे का कार्यप्रवाह।
फोटो: सेब

यह पता लगाना कि जब कोई वास्तव में सिरी को ट्रिगर करना चाहता है, आपकी अपेक्षा से अधिक जटिल साबित होता है। इसे दूर करने के लिए, Apple आपकी आवाज़ को डीप न्यूरल नेटवर्क का उपयोग करके वाक् ध्वनियों पर संभाव्यता वितरण में परिवर्तित करता है। बदले में, एक आत्मविश्वास स्कोर उत्पन्न करता है। यदि यह काफी अधिक है, तो सिरी जाग जाती है।

Apple कम थ्रेशोल्ड वाले स्कोर का भी उपयोग करता है। यदि कॉन्फिडेंस स्कोर उससे मिलता है, लेकिन ऊपरी सीमा से अधिक नहीं है, तो आपके iPhone का प्रोसेसर कुछ सेकंड के लिए अधिक संवेदनशील स्थिति में प्रवेश करता है। इसका मतलब है कि अगर आप कमांड दोहराते हैं तो यह सिरी को और तेज़ी से सक्रिय कर सकता है।

सिरी को और सटीक बनाना

सिरी सटीकता को और बढ़ाने के लिए, ऐप्पल ने अपने मॉडल के लिए "अरे सिरी" वाक्यांश के भाषा-विशिष्ट ध्वन्यात्मक विनिर्देश बनाए। अंग्रेजी में कंपनी दो वेरिएंट का इस्तेमाल करती है। एक में, "सिरी" में पहला स्वर "गंभीर" जैसा लगता है। दूसरे में, यह "सीरिया" जैसा लगता है।

यदि आप मशीन लर्निंग में रुचि रखते हैं और यह जानना चाहते हैं कि क्यूपर्टिनो भाषण मान्यता में इसका उपयोग कैसे करता है, तो दें Apple का पूरा पेपर एक पढ़ा।

नवीनतम ब्लॉग पोस्ट

सैमसंग के स्मार्ट टीवी पर आने वाले iTunes वीडियो और AirPlay 2
October 21, 2021

यह कुछ साल पहले अकल्पनीय लग रहा होगा, लेकिन लंबे समय से ऐप्पल उन्माद सैमसंग ने घोषणा की है कि उसके स्मार्ट टीवी आईट्यून्स मूवीज़ और टीवी शो और ऐप्प...

संगीत और फ़िल्मों से लेकर फ़ोटो और कोडिंग तक 2016 के सर्वश्रेष्ठ iOS ऐप
October 21, 2021

आईओएस ऐप्स के लिए यह एक बैनर वर्ष रहा है। स्मार्ट फोटो-एडिटिंग टूल से लेकर म्यूजिक-जनरेटिंग ऐप्स तक, ऐप्पल और थर्ड-पार्टी डेवलपर्स समान रूप से ऐप ...

| Mac. का पंथ
October 21, 2021

यदि आप अपने iPhone (या iPad) पर स्थानीय या iCloud संग्रहण स्थान से बाहर चल रहे हैं, तो यह जांचने का समय हो सकता है कि संदेश ऐप कितनी जगह ले रहा है...