Bevæge sig over Siri, Alexa: Google ‘ s offline stemmegenkendelse gennembrud nedskæringer svar lag

0
104

Google Cloud ‘ s Tekst-til-Tale-lærer nye sprog, har fået nye stemmer
Google har opdateret AI-drevet tale værktøjer for virksomheder.

Hvis du er en af de få mennesker, der ejer en Google-Pixel telefon, du vil snart være i stand til at opleve stemmegenkendelse uden internet.

Google har annonceret udgivelsen af “en end-to-end-alle-neurale på enheden talegenkender til magten, tale-input i Gboard”, virksomhedens tastatur med Google-Søgning bagt i.

Den teknologi, der kan give Google en kant over Siri og Alexa på at overbevise folk til at tale med maskiner via telefoner og hjem højttalere, der kan levere svar hurtigere, ved at skære ned på den ventetid, der kommer med at sende en anmodning fra en enhed til en ekstern server og venter på et svar.

Selskabet har aktiveret på enheden stemme anerkendelse af miniaturizing en maskine-learning model, der kan gøre opgaven på en telefon, snarere end aflevering fra job til en server i skyen.

Google forskere detaljerede on-enhed teknik i en artikel offentliggjort på arXiv.org i November kaldes “Streaming ende-til-Ende talegenkendelse Til Mobile Enheder”.

Ifølge Google forskere, at den model fungerer på den karakter niveau, så brugeren forkynder, at et ord, maskinen gentager det et tegn på et tidspunkt, præcis, hvor en ekspert menneskelige transcriber ville skrive.

Ud over supreme low-latency talegenkendelse, Google ønskede sit system til at udnytte “on-enhed bruger sammenhæng”, såsom brugerens liste af kontakter, musik apps til at give en liste af sang navne, de kan referere til, og placering.

For at opnå den enhed, intelligens, Google ansat en Tilbagevendende Neurale Netværk (RNN) transducer hjulpet på vej af en nylig innovation, der kaldes ‘Connectionist tidsmæssig klassifikation’, der bruges til uddannelse af neurale netværk. Den teknik, der er tilladt for en mere effektiv måde for maskiner til at fortolke tale.

Google forklarer, at talegenkendelse motor vil normalt afhænge af en søgning graf, der kan være 2 GB i størrelse, hvilket vil være belastende, hvis det er gemt på enheden.

I stedet uddannet et neuralt netværk, der giver de samme nøjagtighed som en klient-server-setup, der var bare 450MB i størrelsen. Ikke tilfreds med, at Google forskere skrumpet model til blot 80 MB.

“Vores nye neurale på enheden Gboard talegenkender er i første omgang at blive lanceret til alle Pixel-telefoner i Amerikansk engelsk,” Google siger forskerne.

“I betragtning af de tendenser, der er i industrien, med konvergens af specialiseret hardware og algoritmisk forbedringer, vi håber, at de teknikker, der præsenteres her, kan hurtigt blive vedtaget i flere sprog og på tværs af bredere anvendelsesområder.”

googlegboardofflinevoicerecogntion.gif

Google sammenligner server-side talegenkender, venstre, med on-enhed genkendelse, højre, ved genkendelse af det samme, der tales sætning.

Billede: Akshay Kannan/Elnaz Sarbar/Google

Tidligere og relaterede dækning

Google undersøger, AI ‘ s mystiske polytope

Forskere på Google Hjernen og DeepMind gå i søgen efter bedre “repræsentationer” af verden ved AI, gennem udforskning af polytope, en Euklidisk geometrisk form, der repræsenterer de mulige løsninger til et spil af strategi.

Google Pixel 3 anmeldelse: Fremragende kamera, kompakt formfaktor, og Google software er overbevisende

I en verden med massiv smartphones, der er stadig et par at komfortabelt passer ind i din hånd og lomme. Google Pixel 3 er den bedste lille Android-smartphone, men det er ikke helt perfekt.

Google Udkig bruger AI til at beskrive omgivelserne for synshandicappede

Ved hjælp af den samme underliggende teknologi, som Google Linse

Google bringer Assistent “fortsatte samtale” – funktionen til intelligent viser

Funktionen giver brugerne mulighed for at engagere sig i en samtale med den stemme-aktiveret assistent uden som forord til hver sætning med “Hey Google.”

Google Cloud opdateringer AI-drevet tale værktøjer for virksomheder

Google ‘ s Tale-til-tekst og Tekst-til-Tale-produkter er at få flere stemmer, flere sprog og lavere priser.

Google AI er meget god til at forudsige, når en patient kommer til at dø

Google tager en ‘gak-it-all” – tilgang til at opbygge predictive analytics for patientresultater.

Google AI på Raspberry Pi: Nu kan du få officielle TensorFlow støtte

Google ‘ s TensorFlow team gør det en hel del nemmere at få AI op og kører på en Raspberry Pi.

Hvad kan Siri og Cortana gøre for at fange op til Alexa og Google Assistent? TechRepublic

Smart assistant teknologier fra data-drevne virksomheder som Google og Amazon er førende på markedet, mens Siri og Cortana er ved at sakke bagud. Her er, hvor sidstnævnte kan gøre gevinster.

Google bringer AI til at sms ‘ e, Sprints 5G planer for lancering CNET

Dagens store tech-historier, der indeholder Google ‘s AI tillæg til sine Beskeder, app, Sprint’ s planer for virksomhedens 5G lanceringen, og nogle hands-on tid med Microsofts nyeste HoloLens 2

Relaterede Emner:

Amazon

CXO

Digital Transformation

Tech-Branchen

Intelligente Byer

Cloud