Google Cloud Text-to-Speech impara nuove lingue, riceve nuove voci
Google Cloud ha aggiornato AI-powered discorso di strumenti per le imprese.
Se sei una delle poche persone che possiedono un account Google Pixel di telefono, sarete presto in grado di esperienza di riconoscimento vocale senza internet.
Google ha annunciato il lancio di “end-to-end, tutto neurale, sul dispositivo di riconoscimento vocale per l’alimentazione input vocale in Gboard”, la tastiera con la Ricerca di Google al forno.
La tecnologia potrebbe dare a Google un bordo sopra Siri e Alexa nel convincere la gente a parlare di macchine attraverso i telefoni di casa e diffusori in grado di fornire le risposte più velocemente, riducendo la latenza che viene fornito con l’invio di una richiesta da un dispositivo a un server remoto e in attesa di una risposta.
L’azienda ha attivato sul dispositivo di riconoscimento vocale di miniaturizzazione una macchina-modello di apprendimento che può svolgere il compito di un telefono, piuttosto che passare il lavoro ad un server in cloud.
Google ricercatori dettagliate sul dispositivo tecnica in un articolo pubblicato su arXiv.org nel mese di novembre chiamato ‘Streaming End-to-End di Riconoscimento Vocale Per Dispositivi Mobili’.
Secondo Google i ricercatori, il modello funziona a livello di carattere, così come l’utente enuncia una parola, la macchina ripete un carattere alla volta, esattamente come un esperto umano trascrittore sarebbe tipo.
Al di là suprema bassa latenza di riconoscimento vocale, Google ha voluto che il suo sistema di sfruttare “sul dispositivo dell’utente di contesto”, come l’elenco di contatti, applicazioni musicali per fornire un elenco di nomi di canzoni che potrebbero essere di riferimento e la posizione.
Per ottenere il dispositivo di intelligence, Google ha impiegato un Reti Neurali Ricorrenti (RNN) trasduttore aiutato da una recente innovazione, chiamato ‘Connessioniste classificazione temporale’ utilizzato per l’addestramento di reti neurali. La tecnica ha consentito per un modo più efficiente per macchine per interpretare il discorso.
Google spiega che il motore di riconoscimento vocale normalmente dipendono da una ricerca grafico che può essere di 2GB, che sarebbe oneroso, se memorizzato su un dispositivo.
Invece, è formato una rete neurale che offre la stessa precisione di una configurazione client-server che è stato appena 450MB dimensioni. Non sono felice, Google ricercatori hanno ristretto il modello solo 80MB.
“La nostra nuova struttura neurale del dispositivo Gboard sistema di riconoscimento vocale è inizialmente in fase di lancio per tutti i telefoni del Pixel in inglese Americano, solo,” Google i ricercatori hanno detto.
“Date le tendenze del settore, con la convergenza di hardware specializzato e miglioramenti algoritmico, speriamo che le tecniche qui presentate possono essere adottati in più lingue e più ampio attraverso i domini di applicazione.”

Google confronta lato server di riconoscimento vocale, a sinistra, con il dispositivo di riconoscimento, a destra, quando riconoscere la stessa frase parlata.
Immagine: Akshay Kannan/Elnaz Sarbar/Google
Precedente e relativa copertura
Google esplora AI misteriosa polytope
I ricercatori di Google Cervello e DeepMind andare alla ricerca del meglio “rappresentazioni” del mondo dalla IA, attraverso l’esplorazione del polytope, un Euclidea forma geometrica che rappresenta le possibili soluzioni di un gioco di strategia.
Google Pixel 3 revisione: Ottima fotocamera, tascabile con fattore di forma, e il software di Google sono convincenti
In un mondo di massiccia di smartphone, ci sono ancora un paio che si adatta comodamente in mano e in tasca. Google Pixel 3 è il miglior smartphone Android, ma non è tutto perfetto.
Google Lookout utilizza IA per descrivere un ambiente per non vedenti
L’utilizzo di simili di base della tecnologia come Google Obiettivo
Google offre Assistente “, ha continuato la conversazione” per smart visualizza
La funzione consente agli utenti di impegnarsi in una conversazione con l’attivazione vocale assistente senza prefazione a ogni affermazione con “Hey Google.”
Google Cloud aggiornamenti AI-powered discorso di strumenti per le imprese
Google Speech-to-Text e Text-to-Speech prodotti sono sempre più voci, più lingue e a prezzi inferiori.
Google AI è molto bravo a predire quando un paziente sta per morire
Google prende un ‘mangiarsi tutto’ approccio alla costruzione di predictive analytics per i risultati per il paziente.
Google IA Raspberry Pi: Ora è ufficiale TensorFlow supporto
Google TensorFlow squadra rende molto più facile per arrivare AI fino e in esecuzione su un Raspberry Pi.
Che cosa può Siri e Cortana fare per raggiungere Alexa e Google Assistant? TechRepublic
Smart assistant tecnologie basate su dati di aziende come Google e Amazon sono leader di mercato, mentre Siri e Cortana sono in ritardo. Ecco come quest’ultimo può fare guadagni.
Google portando ai sms, Sprint 5G piani di lancio di CNET
Oggi le principali notizie tecnologiche includono Google, oltre AI per il suo app Messaggi, Sprint piani per la società 5G di lancio e alcuni hands-on tempo con Microsoft HoloLens 2
Argomenti Correlati:
Amazon
CXO
La Trasformazione Digitale
Settore Tech
Smart Cities
Cloud