Beweeg over Siri, Alexa: Google ‘ s offline spraakherkenning doorbraak bezuinigingen antwoord lag

0
108

Google Cloud ‘ s Tekst-naar-Spraak leert nieuwe talen, krijgt nieuwe stemmen
Google Cloud heeft bijgewerkt AI-aangedreven spraakprogramma ‘ s voor ondernemingen.

Als je een van de weinige mensen die een Google Pixel telefoon, zult u snel in staat om de ervaring van spraakherkenning zonder het internet.

Google heeft aangekondigd dat de uitrol van een “end-to-end all-neurale op het apparaat spraakherkenning gebruikt om de macht van spraak in Gboard”, de vennootschap toetsenbord met Google Zoeken gebakken in.

De technologie zou kunnen geven Google een voorsprong op Siri en Alexa in het overtuigen van mensen om te praten om de machines door middel van telefoons en luidsprekers die kunnen leveren antwoorden sneller, door het kappen van de vertraging die wordt geleverd met het verzenden van een verzoek van een apparaat op een externe server en het wachten op een reactie.

Het bedrijf heeft ingeschakeld op het apparaat spraakherkenning door miniaturizing een machine-learning model dat de taak op een telefoon in plaats van het uitdelen van het werk naar een server in de cloud.

Google onderzoekers gedetailleerde het apparaat techniek in een artikel gepubliceerd op arXiv.org in November zogenaamde ‘Streaming End-to-End spraakherkenning Voor Mobiele Apparaten’.

Volgens Google onderzoekers, het model werkt in het teken niveau, dus als de gebruiker enunciates een woord, de machine herhaalt het één karakter per keer, precies hoe een expert menselijke transcriber zou typen.

Dan allerhoogste low-latency spraakherkenning van Google wilde met haar systeem te exploiteren “op het apparaat de context van de gebruiker”, zoals de gebruiker lijst van contacten, muziek-apps te voorzien in een lijst namen zij zouden kunnen worden verwezen naar, en de locatie.

Om het bereiken van de op het apparaat intelligence, Google gebruikt van een Recurrente Neurale Netwerken (RNN) transducer geholpen door een recente innovatie genaamd ‘Connectionist temporele classificatie’ dat wordt gebruikt voor het trainen van neurale netwerken. De techniek die toegestaan is voor een meer efficiënte manier om machines te interpreteren spraak.

Google legt uit dat de speech-recognition engine normaal zou afhangen van een zoekopdracht grafiek die kunnen worden 2 GB in grootte, die zou worden verlieslatende als deze zijn opgeslagen op een apparaat.

In plaats daarvan een getrainde neurale netwerk met dezelfde nauwkeurigheid als een client-server setup die was gewoon 450MB in grootte. Niet tevreden met dat, de Google-onderzoekers gekrompen het model op slechts 80 MB.

“Onze nieuwe all-neurale op het apparaat Gboard spraakherkenning gebruikt wordt in eerste instantie gestart om alle Pixel telefoons in het Amerikaans engels alleen,” Google onderzoekers gezegd.

“Gezien de trends in de industrie, met de convergentie van gespecialiseerde hardware en algoritmische verbeteringen, zijn we hoopvol gestemd dat de technieken die hier worden gepresenteerd, kan snel worden vastgesteld in meer talen en in bredere domeinen van toepassing.”

googlegboardofflinevoicerecogntion.gif

Google vergelijkt server-side spraakherkenning gebruikt, links, met de op het apparaat recognizer, rechts, bij de herkenning van dezelfde gesproken zin.

Afbeelding: Akshay Kannan/Elnaz Sarbar/Google

Vorige en aanverwante dekking

Google onderzoekt AI ‘ s mysterieuze polytope

Onderzoekers van Google Hersenen en DeepMind gaan in de zoektocht naar beter “verklaringen” van de wereld door de AI, door exploratie van de polytope, een Euclidische geometrische vorm die staat voor de mogelijke oplossingen van het spel van strategie.

Google Pixel 3 beoordeling: Prima camera, compact form factor, en Google software dwingende

In een wereld van massale smartphones, zijn er nog een paar die comfortabel past in uw hand en broekzak. De Google Pixel 3 is de beste kleine Android-smartphone, maar het is niet helemaal perfect.

Google Uitkijk maakt gebruik van AI te beschrijven omgeving voor blinden en slechtzienden

Met behulp van vergelijkbare onderliggende technologie als Google Lens

Google brengt Assistent “vervolg gesprek functie’ smart displays

De functie stelt gebruikers in een gesprek met de spraakgestuurde assistent zonder voorafgaand aan elke stelling met “Hey Google.”

Google Cloud updates AI-aangedreven spraakprogramma ‘ s voor ondernemingen

Google Spraak-naar-Tekst-en Tekst-naar-Spraak-producten worden steeds meer stemmen, meer talen en lagere prijzen.

Google AI is erg goed in het voorspellen wanneer een patiënt gaat sterven

Google neemt een “gobble-it-all’ aanpak voor het bouwen van predictive analytics voor de uitkomst voor de patiënt.

Google AI op de Raspberry Pi: u krijgt Nu officiële ondersteuning TensorFlow

Google TensorFlow team maakt het een stuk makkelijker om AI omhoog en draait op een Raspberry Pi.

Wat kan Siri en Cortana doen om de achterstand op Alexa en Google-Assistent? TechRepublic

Smart assistant technologieën van data-gedreven bedrijven zoals Google en Amazon zijn toonaangevend in de markt, terwijl de Siri en Cortana een achterstand. Hier ‘ s hoe kan de laatstgenoemde winst te maken.

Google brengt AI te sms ‘ en, Sprint 5G plannen voor het lanceren van CNET

Vandaag de grote tech-verhalen van Google ‘s AI naast de Berichten app, Sprint de plannen voor de vennootschap 5G starten en een hands-on tijd met Microsoft’ s nieuwste HoloLens 2

Verwante Onderwerpen:

Amazon

CXO

Digitale Transformatie

Tech Industrie

Smart Cities

Cloud