Microsoft billethajer AI, cirkulære mikrofon fremskridt i overlappede talegenkendelse arbejde

0
84

Nul

På Interspeech 2018 konference i Hyderabad, Indien, i denne uge, Microsoft forskere vil tale op fremskridt i overlappende tale anerkendelse, som de har opnået. En del af den løsning, de vil være til disposition indebærer, at et nyt cirkulære mikrofon array — tilsyneladende den ene, som deltagerne af Microsoft ‘ s Bygge 2018 konference blev i en demonstration, men om, som Microsoft har afvist at afsløre detaljerne.

circularmicarrayspeachresearch.jpg
Kredit: Microsoft

Microsoft og andre, der arbejder med talegenkendelse felt har forsøgt at løse det “cocktail party problem”, altså den situation, hvor højttalere, der overlapper hinanden i et støjende miljø. Systemer skal være i stand til at identificere et varierende antal højttalere med ukendt identitet, tale mønstre og uvedkommende støj.

I en ny videnskabelig artikel, “Erkender Overlappende Tale i Møder: Et Flerkanals Adskillelse Tilgang ved Hjælp af Neurale Netværk,” Microsoft forskere forklare, hvordan de har behandlet overlapper opdagelse og tale adskillelse. For at gøre det, de har brugt både en neurale netværk og traditionelle signal-processing teknikker, der bruger en unmixing transducer, der kan modtage mikrofon signaler og generere en række af tid-synkron lyd-streams.

Fra et billede, der ledsager den September 5 blog-indlæg om forskning papir (som jeg har indlejret i mit indlæg ovenfor), det ser ud som Microsoft forskere har bygget en syv-kanal konisk array mic til møde transskription som en del af deres løsning. Systemet håndterer dereverberation, tale separation og automatisk talegenkendelse, forskning papir siger.

smartmeetingdemobuild.jpg
Kredit: Ben Thompson, YouTube

Billedet af denne mikrofon absolut ser ud som det passer mysteriet enhed, som Microsoft fremhævede på Bygge 2018 i sin demo af mulighederne for møder i fremtiden. (Et billede fra denne demo er indlejret ovenfor.)

Jeg spurgte, Microsoft, hvis dette er faktisk den samme enhed, og hvis virksomheden har overvejet at dreje på mic til et salgbart produkt (enten Microsoft selv eller sin Oem ‘ er) på et tidspunkt. Der er ingen ord tilbage, så langt.

Microsoft forskere viden, i henhold til blog-indlæg i dette system “repræsenterer første overlappede system til talegenkendelse, der har vist sig at fungere godt for egentlige møder med ingen forudgående forudsætninger.”

Microsoft har anvendt arbejde fra sin forskere, der automatisk talegenkendelse område i en række af sine produkter, herunder Cortana, Skype Oversætter, Kontor Diktat, HoloLens og Azure Kognitive Tjenester.

executive-guide

What is AI? Everything you need to know about Artificial Intelligence

Hvad er AI? Alt, hvad du behøver at vide om Kunstig Intelligens

En guide til kunstig intelligens, fra machine learning og generelt AI til neurale netværk.

Læs Mere

Relaterede Emner:

Microsoft

Digital Transformation

CXO

Tingenes Internet

Innovation

Virksomhedens Software

0