In un nuovo post pubblicato sul portale Machine Learning Journal, Apple ha spiegato in maniera dettagliata, e talvolta estremamente tecnica, come Siri su HomePod sia stato progettato per funzionare anche in condizioni acustiche non propriamente favorevoli. Come si comporta lo speaker intelligente di Apple quando un’altra sorgente riproduce musica ad alto volume o quando l’aspirapolvere è in funzione?

A differenza di Siri su iPhone, che funziona quando l’utente avvicina il microfono alla bocca, Siri su HomePod deve funzionare bene anche in ambienti audio ostici. Gli utenti, infatti, devono essere in grado di attivare l’assistente vocale di Apple da molte posizioni, vicine o lontane che siano. Un sistema online completo, in grado di superare tutti i problemi ambientali, richiede un’integrazione notevole di varie tecnologie di elaborazione del segnale multicanale.

Siri su HomePod utilizza algoritmi di apprendimento automatico

Per realizzare ciò, Apple afferma che il team di sviluppo che lavora a Siri ha progettato un sistema di elaborazione del segnale multicanale per l’HomePod che utilizza algoritmi di apprendimento automatico per rimuovere l’eco e il rumore di fondo, separando anche le fonti audio simultanee in modo da eliminare le interferenze.

Tale sistema usa i sei microfoni di HomePod ed è alimentato continuamente dal chip Apple A8, anche quando il dispositivo viene utilizzato nel suo stato di potenza minimo per risparmiare energia. Il filtro multicanale è in grado, quindi, di adattarsi costantemente alle mutevoli condizioni del rumore e ai movimenti dell’utente che interagisce con l’HomePod.

Hey Siri HomePod

I tre nemici principali di HomePod, così come degli altri speaker intelligenti, sono l’eco, il riverbero e il rumore. Di seguito trovate le soluzioni adottate da Apple per contrastare i tre fenomeni:

  • Cancellazione dell’eco: poiché gli altoparlanti sono vicini ai microfoni dell’HomePod, la riproduzione della musica può essere notevolmente più forte del comando vocale “Hey Siri”, specialmente quando questo proviene da un utente che non si trova nelle immediate vicinanze del dispositivo. Per combattere l’eco, Siri su HomePod implementa un algoritmo di cancellazione dell’eco multicanale.
  • Rimozione del riverbero: quando l’utente pronuncia “Hey Siri” e si allontana dall’HomePod, all’interno della stanza si creano code di riverbero che possono ridurre la qualità e l’intelligibilità del comando vocale. Per contrastare tale fenomeno acustico, Siri su HomePod monitora continuamente le caratteristiche della stanza e rimuove il riverbero tardivo, preservando i componenti di riflessione diretta e iniziale nei segnali del microfono.
  • Riduzione del rumore: quando si pronuncia un comando vocale a distanza, questo può essere contaminato da rumori provenienti da elettrodomestici, suoni esterni e così via. Per combattere questo problema, HomePod utilizza metodi di ottimizzazione vocale all’avanguardia che creano un filtro fisso per ogni espressione.

Apple sostiene di aver testato il sistema di elaborazione del segnale multicanale di HomePod in diverse condizioni acustiche, tra cui figurano la riproduzione di musica e podcast a diversi volumi, il rumore di fondo continuo come può essere quello della pioggia o di una conversazione e i rumori provenienti da elettrodomestici come aspirapolvere, asciugacapelli e microonde. Durante questi test, Apple ha variato spesso la posizione di HomePod per coprire diversi casi d’uso.

Il post si conclude con un riepilogo delle misurazioni delle prestazioni di Siri su HomePod, con grafici che mostrano che il sistema di elaborazione del segnale multicanale di Apple ha portato ad una maggiore precisione e ad un minor numero di errori. Chi volesse saperne di più, può consultare l’articolo completo sul Machine Learning Journal di Apple disponibile, in lingua originale, a questo indirizzo.