Nul
På Interspeech 2018 konference i Hyderabad, Indien, i denne uge, Microsoft forskere vil tale op fremskridt i overlappende tale anerkendelse, som de har opnået. En del af den løsning, de vil være til disposition indebærer, at et nyt cirkulære mikrofon array — tilsyneladende den ene, som deltagerne af Microsoft ‘ s Bygge 2018 konference blev i en demonstration, men om, som Microsoft har afvist at afsløre detaljerne.

Kredit: Microsoft
Microsoft og andre, der arbejder med talegenkendelse felt har forsøgt at løse det “cocktail party problem”, altså den situation, hvor højttalere, der overlapper hinanden i et støjende miljø. Systemer skal være i stand til at identificere et varierende antal højttalere med ukendt identitet, tale mønstre og uvedkommende støj.
I en ny videnskabelig artikel, “Erkender Overlappende Tale i Møder: Et Flerkanals Adskillelse Tilgang ved Hjælp af Neurale Netværk,” Microsoft forskere forklare, hvordan de har behandlet overlapper opdagelse og tale adskillelse. For at gøre det, de har brugt både en neurale netværk og traditionelle signal-processing teknikker, der bruger en unmixing transducer, der kan modtage mikrofon signaler og generere en række af tid-synkron lyd-streams.
Fra et billede, der ledsager den September 5 blog-indlæg om forskning papir (som jeg har indlejret i mit indlæg ovenfor), det ser ud som Microsoft forskere har bygget en syv-kanal konisk array mic til møde transskription som en del af deres løsning. Systemet håndterer dereverberation, tale separation og automatisk talegenkendelse, forskning papir siger.
Kredit: Ben Thompson, YouTube
Billedet af denne mikrofon absolut ser ud som det passer mysteriet enhed, som Microsoft fremhævede på Bygge 2018 i sin demo af mulighederne for møder i fremtiden. (Et billede fra denne demo er indlejret ovenfor.)
Jeg spurgte, Microsoft, hvis dette er faktisk den samme enhed, og hvis virksomheden har overvejet at dreje på mic til et salgbart produkt (enten Microsoft selv eller sin Oem ‘ er) på et tidspunkt. Der er ingen ord tilbage, så langt.
Microsoft forskere viden, i henhold til blog-indlæg i dette system “repræsenterer første overlappede system til talegenkendelse, der har vist sig at fungere godt for egentlige møder med ingen forudgående forudsætninger.”
Microsoft har anvendt arbejde fra sin forskere, der automatisk talegenkendelse område i en række af sine produkter, herunder Cortana, Skype Oversætter, Kontor Diktat, HoloLens og Azure Kognitive Tjenester.
executive-guide
Hvad er AI? Alt, hvad du behøver at vide om Kunstig Intelligens
En guide til kunstig intelligens, fra machine learning og generelt AI til neurale netværk.
Læs Mere
Relaterede Emner:
Microsoft
Digital Transformation
CXO
Tingenes Internet
Innovation
Virksomhedens Software
0