Περισσότερα στο «Hey Siri» από ό, τι νομίζετε

Περισσότερα στο «Hey Siri» από ό, τι νομίζετε

Siri Alexa στη φωνητική αναφορά
Πολλοί άνθρωποι μπορεί να αγνοούν ότι το iPhone τους διαθέτει ένα νευρωνικό δίκτυο αφιερωμένο στο να τους ακούει να λένε "Hey Siri".
Φωτογραφία: Apple

Το να απαντά το iPhone σας στο "Hey Siri" φαίνεται τόσο απλό πράγμα, αλλά στην πραγματικότητα είναι αρκετά περίπλοκο. Η αναγνώριση αυτής της κωδικής φράσης και του ατόμου που την είπε, είναι ζωτικής σημασίας για το σύστημα αναγνώρισης ομιλίας της Apple.

Μια ανάρτηση στην Apple Εφημερίδα Μηχανικής Μάθησης που μόλις δημοσιεύτηκε σήμερα περιγράφει πολλές από τις προκλήσεις που ξεπέρασαν οι προγραμματιστές για να κάνουν αυτό το έργο.

Μία από τις επιπλοκές είναι ότι η αναγνώριση του "Hey Siri" πρέπει να συμβεί στο iPhone ή το iPad. Το μεγαλύτερο μέρος της αναγνώρισης ομιλίας του Siri γίνεται με τη μεταφόρτωση των λέξεων του χρήστη σε απομακρυσμένο διακομιστή, αλλά αυτό ξεκινά μόνο αφού η φράση "Hey Siri" αναγνωριστεί από το τηλέφωνο. Η δέσμευση της Apple για την προστασία της ιδιωτικής ζωής αποτρέπει το iPhone από το να στέλνει όλα όσα ακούει σε έναν διακομιστή.

Κάθε τηλέφωνο και τα περισσότερα tablet της Apple από το iPhone 6s είχαν επεξεργαστή χαμηλής ισχύος και πάντα ενεργοποιημένο που ακούει συνεχώς τη φράση-κλειδί "Hey Siri". Αυτό κάνει όλο αυτό το τσιπ. Αυτός ο επεξεργαστής αναγνώρισης φωνής χρησιμοποιεί ένα νευρωνικό δίκτυο που μιμείται τη διάταξη ενός ζωντανού εγκεφάλου.

ο Εφημερίδα Μηχανικής Μάθησης Το άρθρο αφορά μόνο το "Hey Siri" επειδή όλη η υπόλοιπη αναγνώριση ομιλίας του Siri γίνεται σε διακομιστές. Αυτή είναι μια εντελώς διαφορετική διαδικασία. Και ένα αυτό έχει μια σειρά από προβλήματα. Ωστόσο, η Apple είναι σε ένα ξεφάντωμα πρόσληψης να τα φτιάξω.

Γιατί "Hey Siri";

Η Apple επέλεξε τη φράση -κλειδί της επειδή είναι σύντομη και εύκολη στο να την πει. Το σύστημα αναγνώρισης φωνής Siri έκανε το ντεμπούτο του στο iPhone 4S αρκετά χρόνια πριν, αλλά απαιτούσε το πάτημα του κουμπιού Home για ενεργοποίηση. Σύμφωνα με την Apple, πολλοί άνθρωποι ξεκίνησαν τα αιτήματά τους με το "Hey Siri" ακόμη και πριν αυτή η φράση είχε κάποιο ρόλο.

Το αρνητικό είναι ότι αυτή η βασική φάση μοιάζει με πολλές άλλες φράσεις, όπως "μιλάς σοβαρά;". Ο αποκλειστικός επεξεργαστής του iPhone πρέπει επίσης να αντιμετωπίσει όλους τους άλλους ανθρώπους που συζητούν κοντά, μερικοί από τους οποίους μπορεί να μιλούν με τα δικά τους iPhone.

Σύμφωνα με το σημερινό Εφημερίδα Μηχανικής Μάθησης άρθρο, το τσιπ επιλέγει πρώτα τη φράση "Hey Siri" από αυτό που ακούει, και στη συνέχεια ελέγχει αν η φράση ειπώθηκε από το άτομο που εκπαιδεύτηκε να ακούει.

Ο επεξεργαστής μετατρέπει τον ήχο σε διάνυσμα 13 διαστάσεων για να αναγνωρίσει ότι κάποιος είπε "Hey Siri". Στη συνέχεια μετατρέπει τον ήχο σε διάνυσμα 442 διαστάσεων για να διαπιστώσει εάν ο σωστός ομιλητής εκφώνησε τη φράση κλειδί.

Η Apple δημοσίευσε τις λεπτομέρειες για το πώς επιλέγει την πολύ σημαντική φράση από τον αέρα σε ένα Εφημερίδα Μηχανικής Μάθησης άρθρο τον Οκτώβριο. Η νεότερη ανάρτηση συζητά πώς το νευρικό τσιπ μαθαίνει να αναγνωρίζει τον ιδιοκτήτη του.

Εκπαίδευση "Hey Siri"

Όλοι θυμούνται ότι έπρεπε να εκπαιδεύσουν το iPhone τους να αναγνωρίζει τη φωνή τους λέγοντας «Hey Siri» αρκετές φορές. Αυτό ονομάζεται ρητή εγγραφή.

Αυτό που πολύ λίγοι άνθρωποι συνειδητοποιούν είναι ότι το σύστημα συνεχίζει να μαθαίνει πώς ακούγεται η φωνή τους μετά την προπόνηση. Αυτό συμβαίνει επειδή η συνεδρία γίνεται σχεδόν πάντα υπό ιδανικές συνθήκες, ενώ το iPhone πρέπει να μάθει να αναγνωρίζει το "Hey Siri" με κάθε είδους θόρυβο περιβάλλοντος. Για αρκετό καιρό μετά την επίσημη λήξη της προπόνησης, κάθε χρήση του "Hey Siri" χρησιμοποιείται για να μάθετε περισσότερα.

Προσπαθήστε, λοιπόν, να μην αφήσετε άλλους ανθρώπους να πουν "Hey Siri" κοντά στο iPhone σας, ενώ ακόμα μαθαίνει τη φωνή σας.

Η προστασία της ιδιωτικής ζωής έχει σημασία

Η Apple έθεσε ένα δύσκολο έργο όταν αποφάσισε να κάνει αναγνώριση φωνής απευθείας σε ένα smartphone. Αλλά η εναλλακτική λύση ήταν να στείλετε εγγραφές για όλα όσα λέγονται κοντά στο iPhone σε απομακρυσμένο διακομιστή για να αναγνωρίσετε τη φράση κλειδί. Η Apple δεν επρόκειτο να μετατρέψει τις συσκευές της σε κατασκόπους.

Φυσικά, αυτό δεν ενοχλούσε την Amazon. Έτσι ακριβώς οι συσκευές Echo κάνουν όλη την αναγνώριση ομιλίας τους.

Τελευταία δημοσίευση ιστολογίου

| Cult of Mac
September 11, 2021

Θεαματικό χωρίς εκπλήξεις: Τι πιστεύουν οι κριτικοί για το iPhone 6sΡίξτε μια ματιά στο metareview του iPhone 6s.Φωτογραφία: AppleΈχουν περάσει δύο...

| Cult of Mac
September 12, 2021

Οι αποστολές Mac μειώθηκαν πέρυσι, αλλά μειώθηκαν και οι αποστολές υπολογιστώνΗ κυκλοφορία του MacBook Pro 2018 δεν ήταν αρκετή για να βελτιώσει τι...

Η Wall Street Journal φέρεται να υπογράφει την υπηρεσία συνδρομής Apple News
September 11, 2021

Wall Street Journal φέρεται να υπογράφει για την υπηρεσία συνδρομής Apple NewsΗ Wall Street Journal θα ήταν ένας εξαιρετικός συνεργάτης για την υπη...