Flytta över Siri, Alexa: Google offline röstigenkänning genombrott nedskärningar svar lag

0
125

Google Cloud ‘ s Text-till-Tal-lär sig nya språk, få nya röster
Google har uppdaterat AI-drivna tal verktyg för företag.

Om du är en av de få människor som äger en Google Pixel telefonen, du kommer snart att kunna uppleva röstigenkänning utan internet.

Google har meddelat lanseringen av “end-to-end, i alla neurala, på enheten tal identifierare för att driva tal in i Gboard”, bolagets tangentbord med Google-Sökning bakad i.

Tekniken kan ge Google en kant över Siri och Alexa i att övertyga människor att prata med maskiner via telefoner och hem-högtalare som kan leverera svar snabbare, genom att skära ner på den fördröjning som kommer med att skicka en begäran från en enhet till en avlägsen server och väntar på ett svar.

Bolaget har aktiverat på enheten röst erkännande av miniatyrisering en machine-learning-modell som kan göra uppgiften på en telefon snarare än att lämna bort jobbet till en server i molnet.

Google forskare närmare på enheten teknik i en artikel publicerad på arXiv.org i November som kallas “Streaming End-to-end taligenkänning För Mobila Enheter”.

Enligt Google forskare, modellen fungerar på tecken-nivå, så som användaren klargör ett ord, maskinen upprepar det som ett tecken på en tid, exakt hur en expert mänskliga singeln skulle skriva.

Utöver högsta low-latency taligenkänning, Google ville att dess system för att utnyttja “på enheten user context”, såsom användarens kontaktlista, musik-appar för att ge en lista av song-namn som de kan hänvisa till, och plats.

För att uppnå det på enheten intelligens, Google sysselsatt en Återkommande Neurala Nätverk (RNN) givaren med hjälp av en ny innovation som kallas “Connectionist timliga klassificering” som används för utbildning av neurala nätverk. Tekniken tillät för ett mer effektivt sätt för datorer att tolka tal.

Google förklarar att taligenkänning motorn normalt skulle bero på en sökning graf som kan vara 2GB i storlek, vilket skulle vara betungande om de är lagrade på en enhet.

I stället utbildade ett neuralt nätverk som ger samma noggrannhet som en klient-server-installation som var bara 450 MB i storlek. Inte nöjd med att Google forskare krympt modell för att bara 80 MB.

“Vår nya allt-neural på enheten Gboard tal identifierare är initialt att lanseras till alla Pixel telefoner i Amerikansk engelska,” Google forskarna säger.

“Med tanke på de tendenser i branschen, med konvergens av specialiserad hårdvara och algoritmisk förbättringar, vi hoppas på att de tekniker som presenteras här kan snart att antas i fler språk och över större områden av ansökan.”

googlegboardofflinevoicerecogntion.gif

Google jämför server-side-tal identifierare, till vänster, med på-enhet identifierare, till höger, vid tolkning av samma talad mening.

Bild: Akshay Kannan/Elnaz Sarbar/Google

Tidigare och relaterade täckning

Google undersöker AI mystiska polytope

Forskare på Google Hjärnan och DeepMind gå i jakt på ett bättre “representationer” av världen som AI, genom prospektering av polytope, en Euklides geometriska form som representerar möjliga lösningar till ett spel av strategi.

Google Pixel 3 omdöme: Utmärkt kamera, samma formfaktor, och Google är tvingande

I en värld av massiv smartphones, det finns fortfarande en del att bekvämt passa i din hand och ficka. Google Pixel 3 är den bästa lilla Android-smartphone, men det är inte helt perfekt.

Google Jakt använder AI för att beskriva omgivningen för synskadade

Med hjälp av liknande underliggande teknik som Google Lins

Google ger Assistent är “fortsatt samtal” – funktionen för smart visar

Den funktionen kan användarna delta i ett samtal med den röststyrda assistenten utan prefacing varje uttalande med: “Hallå Google.”

Google Cloud uppdateringar AI-drivna tal verktyg för företag

Googles Tal-till-Text och Text-till-Tal-produkter är att få fler röster, fler språk och lägre priser.

Google AI är mycket bra på att förutsäga när en patient kommer att dö

Google tar en “sluka-it-all’ strategi för att bygga predictive analytics för patientens resultat.

Google AI på Raspberry Pi: Nu får du officiella TensorFlow stöd

Googles TensorFlow team gör det hela mycket lättare att få upp AI och kör på en Raspberry Pi.

Vad kan Siri och Cortana göra för att fånga upp till Alexa och Google Assistent? TechRepublic

Smart assistant-teknik från data-drivna företag som Google och Amazon är marknadsledande, medan Siri och Cortana är att hamna på efterkälken. Här är hur de senare kan göra vinster.

Google föra AI att skicka sms, Sprints 5G starta planer CNET

Dagens stora tech berättelser innehåller Googles AI utöver sina Meddelanden app, Sprint: s planer för företagets 5G starta och lite hands on-tid med Microsofts senaste HoloLens 2

Relaterade Ämnen:

Amazon

CXO

Digital Omvandling

Tech-Industrin

Smarta Städer

Cloud