Microsoft AI bagarini, circolare microfono progressi in sovrapposti di riconoscimento vocale di lavoro

0
100

Zero

Al Interspeech 2018 conferenza in Hyderabad, India, questa settimana, Microsoft, i ricercatori parlare progressi in sovrapposti di riconoscimento vocale che hanno raggiunto. Parte della soluzione che sarà delineando prevede una nuova circolare per microfono-apparentemente quello che i partecipanti di Microsoft Build 2018 conferenza ha visto in una dimostrazione, ma Microsoft ha rifiutato di rivelare i dettagli.

circularmicarrayspeachresearch.jpg
Credito: Microsoft

Microsoft e altri che lavorano nel riconoscimento vocale campo hanno tentato di affrontare il “cocktail party problema”, cioè la situazione in cui i relatori si sovrappongono in un ambiente rumoroso. I sistemi devono essere in grado di identificare un numero variabile di altoparlanti con sconosciuto identità, modelli di discorso e rumori estranei.

In un nuovo documento di ricerca, “Riconoscendo Sovrapposti Discorso Incontri: Un Multicanale Separazione Utilizzando l’Approccio di Reti Neurali,” Microsoft ricercatori spiegano come hanno affrontato la sovrapposizione di rilevamento di discorso e di separazione. Per farlo, ho usato sia una rete neurale e tradizionale segnale di tecniche di elaborazione utilizzando un unmixing trasduttore in grado di ricevere segnali del microfono e generare un certo numero di tempo sincrono di flussi audio.

Da un’immagine che accompagna il 5 settembre post sul blog l’articolo di ricerca (che ho incluso nel mio post sopra), sembra che i ricercatori Microsoft hanno costruito un sette-canale conica matrice microfono per riunioni di trascrizione come parte della loro soluzione. Il sistema gestisce dereverberation, discorso di separazione e riconoscimento vocale automatico, il documento di ricerca dice.

smartmeetingdemobuild.jpg
Credito: Ben Thompson, YouTube

L’immagine di questo microfono, che sicuramente sembra che corrisponda al mistero dispositivo che Microsoft presenti a Costruire il 2018 nel suo demo di possibilità di incontri in futuro. (Un’immagine a partire dalla demo è incorporato in precedenza).

Ho chiesto a Microsoft se questo è, infatti, lo stesso dispositivo e, se la società ha ritenuto di tornitura il mic in un prodotto commerciabile (da Microsoft stessa o i suoi Oem) a un certo punto. Nessuna parola indietro nel tempo.

Per i ricercatori Microsoft knowledge, secondo il post sul blog, questo sistema “rappresenta il primo sovrapposti di riconoscimento vocale del sistema che ha dimostrato di funzionare bene per reali incontri senza prima ipotesi.”

Microsoft ha utilizzato il lavoro da i suoi ricercatori nel riconoscimento vocale automatico area in un certo numero di prodotti, tra cui Cortana, Skype Translator, Ufficio di Dettatura, HoloLens e Azure Cognitive Servizi.

guida esecutiva

What is AI? Everything you need to know about Artificial Intelligence

Che cosa è l’IA? Tutto quello che devi sapere sull’Intelligenza Artificiale

Una guida all’intelligenza artificiale, machine learning e generale AI alle reti neurali.

Leggi Di Più

Argomenti Correlati:

Microsoft

La Trasformazione Digitale

CXO

Internet delle Cose

L’innovazione

Enterprise Software

0