Microsoft svartabörshajar AI, cirkulär mikrofon framsteg i överlappande tal erkännande arbete

0
121

Noll

På Interspeech 2018 konferens i Hyderabad, Indien, denna vecka, Microsoft forskare kommer att prata upp framsteg i överlappande tal erkännande som de har uppnått. En del av lösningen för att de ska vara som beskriver innebär en ny cirkulär array-mikrofon — till synes den som deltagarna i Microsofts Bygga 2018 konferensen såg i en demonstration, men som Microsoft har avböjt att avslöja detaljerna.

circularmicarrayspeachresearch.jpg
Kredit: Microsoft

Microsoft och andra som arbetar inom taligenkänning område har försökt att ta itu med den “cocktail party problem”, dvs den situation där talare överlappar varandra i en bullrig miljö. System behöver för att kunna identifiera ett varierande antal högtalare med okänd identitet, tal mönster och ovidkommande brus.

I en ny forskningsrapport, “Erkänna Överlappande Tal i Möten: En Flerkanalig Separation Strategi med Hjälp av Neurala Nätverk,” Microsoft forskare förklara hur de har hanterat överlappar upptäckt och tal separation. Att göra så, att de har använt både ett neuralt nätverk och traditionella signal-behandling-metoder med en unmixing givare som kan ta emot mikrofon signaler och generera ett antal gång-synkroniserat ljud strömmar.

Från en bild som följer med den 5 September blogginlägg om uppsatsen (som jag har bäddat in i mitt inlägg ovan), ser det ut som att Microsoft har forskare byggt en sju-kanal koniska array mik för mötes-och transkription som en del av sin lösning. Systemet hanterar dereverberation, tal separation och automatisk taligenkänning, säger uppsatsarbete.

smartmeetingdemobuild.jpg
Kredit: Ben Thompson, YouTube

Bilden av denna mikrofon ser definitivt ut som att det matchar mysterium enhet som Microsoft presenterade på att Bygga 2018 i sin demo av möjligheterna till möten i framtiden. (En bild från denna demo är inbäddad ovan.)

Jag frågade Microsoft om detta är verkligen samma enhet, och om företaget har övervägt att vrida på mic till en säljbar produkt (antingen Microsoft självt eller dess Oem) vid något tillfälle. Inte ett ord tillbaka så långt.

Att Microsoft forskare kunskap, enligt blogginlägget här systemet “är den första överlappade taligenkänning system som har visat sig fungera bra för verkliga möten med ingen tidigare antaganden.”

Microsoft har använt arbete från dess forskare i automatisk taligenkänning området i ett antal av sina produkter, bland annat Cortana, Skype Översättare, Kontor Diktamen, HoloLens och Azure Kognitiva Tjänster.

verkställande guide

What is AI? Everything you need to know about Artificial Intelligence

Vad är AI? Allt du behöver veta om Artificiell Intelligens

En guide till artificiell intelligens, från maskininlärning och allmänna AI att neurala nätverk.

Läs Mer

Relaterade Ämnen:

Microsoft

Digital Omvandling

CXO

Sakernas Internet

Innovation

Affärssystem

0