Microsoft skubber foran med en samtale, transskription, virtual microphone arrays

0
159
microsoftvirtualarrayconversationtranslation.jpg

Kredit: Microsoft

Microsoft viste nogle interessante fremskridt på smart-møder foran i denne uge under sin Bygge 2019 keynote. Virksomheden embedsmænd fremviste en ny Samtale Transskription kapacitet, som er en del af sin Azure Tale Tjeneste. Den nye kapacitet, der nu er i uddrag, giver real-time transskription af multi-user samtaler med automatisk højttaler attribution-selv når der er cross-talk sker.

Men der var en anden del af dette års Bygge 2019 demonstration af, at der skete så hurtigt, at mange (herunder mig), som oprindeligt kan have gået glip af det: Microsoft viste denne tjeneste arbejder ikke kun på dets tilpassede mikrofon-array reference hardware-ligesom det gjorde på sidste års Bygge — men ved hjælp af en cloud-drevet virtual microphone array.

Den virtuelle/cloud stykke af dette-er stadig en Microsoft Research-projekt, som er kodenavnet “Projekt Danmark”. I stedet for at være afhængig af dedikeret mikrofon arrays, Projekt Danmark giver brugerne mulighed for at oprette “virtuelle” mikrofon arrays ved hjælp af forbruger-enheder som mobiltelefoner og bærbare computere med almindelige mikrofoner. Det passer ind i Microsofts udvikling ambient-computing-strategi.

“Algoritmer til at kombinere tale information på flere niveauer udbytte transskription nøjagtighed, at tiltag, som fra tæt-taler mikrofoner,” siger Projektets forskere Danmark. Der er et nyt projekt side for Projektet Danmark på Microsoft Research websted (tak til WalkingCat for link), samt en teknisk rapport om Danmark.

Fra Microsoft Research ‘ s blog indlæg om sine meddelelser fra Bygge år:

“Projekt Danmark kan potentielt bidrage til at vores kunder lettere at transskribere samtaler når som helst og hvor som helst ved hjælp af Azure tale tjenester, med eller uden en dedikeret mikrofon array KR. Fremtidige anvendelse scenarier er bred. For eksempel kan vi parret op til flere Microsoft Translator-programmer for at hjælpe flere mennesker til at kommunikere mere effektivt ved hjælp af mobiltelefoner til at minimere de sproglige barrierer.”

Microsoft meddelte i denne uge, at det vil være at gøre den mystiske cirkulære mikrofon array hardware, som vi først så på Bygge 2018 til rådighed for personer uden for virksomheden i form af enheden udvikler kits (som er kodenavnet “Princeton Tower). Kun med lyd, mikrofon array DDKs kan købes fra http://ddk.roobo.com for omkring $100. Advanced audio-visuelle mikrofon array DDKs er tilgængelige fra Microsoft systems integration partnere.

Talen Enheder developer Kit er lavet til dem, der ønsker at opbygge enheder til tilpassede virtuelle assistenter, samtale transskription og smarte højttalere. (Azure Kinect developer kit også kan håndtere samtalen, transskription, for hvad det er værd.)

På Bygge 2018, https://www.zdnet.com/article/microsoft-moves-toward-consolidating-its-many-speech-services/ og software development kit (SDK), der vil arbejde på tværs af sine produkter og tjenester, herunder Windows, Office, Cortana, Xbox, og HoloLens.

Relaterede Emner:

Microsoft

Produktivitet

Hardware

Samarbejde

Fremtidige Arbejde