Zero
Al Interspeech 2018 conferenza in Hyderabad, India, questa settimana, Microsoft, i ricercatori parlare progressi in sovrapposti di riconoscimento vocale che hanno raggiunto. Parte della soluzione che sarà delineando prevede una nuova circolare per microfono-apparentemente quello che i partecipanti di Microsoft Build 2018 conferenza ha visto in una dimostrazione, ma Microsoft ha rifiutato di rivelare i dettagli.

Credito: Microsoft
Microsoft e altri che lavorano nel riconoscimento vocale campo hanno tentato di affrontare il “cocktail party problema”, cioè la situazione in cui i relatori si sovrappongono in un ambiente rumoroso. I sistemi devono essere in grado di identificare un numero variabile di altoparlanti con sconosciuto identità, modelli di discorso e rumori estranei.
In un nuovo documento di ricerca, “Riconoscendo Sovrapposti Discorso Incontri: Un Multicanale Separazione Utilizzando l’Approccio di Reti Neurali,” Microsoft ricercatori spiegano come hanno affrontato la sovrapposizione di rilevamento di discorso e di separazione. Per farlo, ho usato sia una rete neurale e tradizionale segnale di tecniche di elaborazione utilizzando un unmixing trasduttore in grado di ricevere segnali del microfono e generare un certo numero di tempo sincrono di flussi audio.
Da un’immagine che accompagna il 5 settembre post sul blog l’articolo di ricerca (che ho incluso nel mio post sopra), sembra che i ricercatori Microsoft hanno costruito un sette-canale conica matrice microfono per riunioni di trascrizione come parte della loro soluzione. Il sistema gestisce dereverberation, discorso di separazione e riconoscimento vocale automatico, il documento di ricerca dice.
Credito: Ben Thompson, YouTube
L’immagine di questo microfono, che sicuramente sembra che corrisponda al mistero dispositivo che Microsoft presenti a Costruire il 2018 nel suo demo di possibilità di incontri in futuro. (Un’immagine a partire dalla demo è incorporato in precedenza).
Ho chiesto a Microsoft se questo è, infatti, lo stesso dispositivo e, se la società ha ritenuto di tornitura il mic in un prodotto commerciabile (da Microsoft stessa o i suoi Oem) a un certo punto. Nessuna parola indietro nel tempo.
Per i ricercatori Microsoft knowledge, secondo il post sul blog, questo sistema “rappresenta il primo sovrapposti di riconoscimento vocale del sistema che ha dimostrato di funzionare bene per reali incontri senza prima ipotesi.”
Microsoft ha utilizzato il lavoro da i suoi ricercatori nel riconoscimento vocale automatico area in un certo numero di prodotti, tra cui Cortana, Skype Translator, Ufficio di Dettatura, HoloLens e Azure Cognitive Servizi.
guida esecutiva
Che cosa è l’IA? Tutto quello che devi sapere sull’Intelligenza Artificiale
Una guida all’intelligenza artificiale, machine learning e generale AI alle reti neurali.
Leggi Di Più
Argomenti Correlati:
Microsoft
La Trasformazione Digitale
CXO
Internet delle Cose
L’innovazione
Enterprise Software
0