Microsoft touts AI, ronde microfoon ontwikkelingen in de overlappende spraakherkenning werk

0
88

Nul

Op de Interspeech 2018 conferentie in Hyderabad, India, deze week, heeft Microsoft onderzoekers zullen praten tot vooruitgang in de overlappende spraakherkenning die ze hebben bereikt. Een deel van de oplossing zullen ze schetsen waarbij een nieuwe ronde microfoon — schijnbaar degene die de deelnemers van Microsoft ‘ s Build 2018 conferentie zag in een demonstratie, maar over die van Microsoft is gedaald naar het onthullen van informatie.

circularmicarrayspeachresearch.jpg
Credit: Microsoft

Microsoft en anderen die werken in de spraakherkenning veld zijn een poging om de “cocktail party probleem,” dat wil zeggen, de situatie waarin sprekers elkaar overlappen in een lawaaiige omgeving. Systemen moeten in staat zijn om een verschillend aantal luidsprekers met een onbekende identiteit, spraak patronen en externe ruis.

In een nieuw onderzoek papier, “het Erkennen van Overlappende Spraak-in-Bijeenkomsten: Een Multichannel Scheiding Aanpak met Behulp van Neurale Netwerken,” Microsoft-onderzoekers leggen uit hoe ze het hebben aangepakt overlap detectie en spraak scheiding. Om dit te doen, heb ze beide gebruikt een neuraal netwerk en traditionele signaal-processing technieken met behulp van een unmixing transducer die kan ontvangen microfoon signalen en het genereren van een aantal time-synchrone audio streams.

Van een afbeelding die bij het 5 September blog post over het onderzoek op papier (die ik heb opgenomen in mijn post hierboven), het lijkt erop dat Microsoft onderzoekers hebben gebouwd een zeven-kanaals conische microfoon-array voor de vergadering van de transcriptie als onderdeel van hun oplossing. Het systeem regelt dereverberation, spraak scheiding en automatische spraakherkenning, het onderzoek op papier zegt.

smartmeetingdemobuild.jpg
Credit: Ben Thompson, YouTube

Het beeld van deze microfoon ziet er zeker als het overeenkomt met het mysterie apparaat dat Microsoft aanbevolen bij het Bouwen 2018 in de demo van de mogelijkheden van de vergaderingen in de toekomst. (Een beeld uit die demo is ingesloten hierboven.)

Ik vroeg Microsoft als dit is, inderdaad, hetzelfde apparaat en als het bedrijf beschouwd als het draaien van de microfoon in een verkoopbaar product (door Microsoft zelf of de Oem ‘ s) op een bepaald punt. Geen woord terug zo ver.

Microsoft onderzoekers kennis, volgens de blog post, dit systeem “is het eerste overlappende speech recognition systeem dat zich heeft bewezen goed te werken voor de eigenlijke vergaderingen, zonder voorafgaande veronderstellingen.”

Microsoft heeft gemaakt van het werk van de onderzoekers in de automatische spraakherkenning gebied in een aantal van zijn producten, met inbegrip van Cortana, Skype Vertaler, Office Dicteren, HoloLens en Azure Cognitieve Diensten.

executive gids

What is AI? Everything you need to know about Artificial Intelligence

Wat is AI? Alles wat u moet weten over Kunstmatige Intelligentie

Een gids voor kunstmatige intelligentie, van machine learning en algemene AI-neurale netwerken.

Lees Meer

Verwante Onderwerpen:

Microsoft

Digitale Transformatie

CXO

Het Internet van Dingen

Innovatie

Enterprise Software

0