Tenere il telefono cellulare: Avvio Dialpad scommesse voce AI è la chiave per trasformare il front office

0
115

Come combattere robocalls: Le nozioni di base
Non è possibile bloccare la posta indesiderata di telefonate, ma il blocco di alcuni è di meglio che bloccare nessuno. Leggi di più: https://zd.net/2GGv83H

Una particolare zona calda del software aziendale, negli ultimi anni è stato il front office e funzioni come le vendite e il supporto. C’è una corsa per trasformare l’intera “go-to-market” del processo, e, più di recente, che infuria mercato è entrato in collisione con un altro molto caldo, industria, Internet e servizi voce sostituire i telefoni con il sistema cloud-based di comunicazione.

Gettare in un po ‘ di intelligenza artificiale, e che cosa avete? A San Francisco, in startup chiamata Dialpad, fondata nel 2011, sta cercando di trasformatore di assistenza clienti, vendite e marketing, con un po ‘ di machine learning e di un sacco di dati. La società ha ricevuto 120 milioni di dollari in finanziamenti in quattro turni da Google, Andreessen Horowitz, e altri.

“Questo mercato è enorme”, dice Craig Walker, fondatore e chief executive di Dialpad, in un’intervista a ZDNet. “E’ il più grande TAM c’è,” utilizzo di Wall Street che in gergo un “mercato totale indirizzabile.”

Quello che Walker si riferisce sono quattro funzioni che possono essere trasformati, egli ritiene che, attraverso la voce di chiamata software: conferenza Vocale; la sostituzione delle tradizionali “private branch exchange, o di “PBX”; il “centro commerciale” di una società; e la tradizionale call center. Insieme, essi costituiscono un 140 miliardi di dollari, mercato noto come “enterprise voice”. Walker ha visto il mercato evolve: egli è stato in precedenza il product manager di Google Voice e relativi prodotti, dopo aver venduto un avvio precedente, GrandCentral di Comunicazione, a Google nel 2007.

Ci sono un sacco di giocatori che di 140 miliardi di dollari TAM, come lo Zoom di Comunicazione Video, RingCentral, Five9, e Cisco Systems. E c’è stato un sacco di attività di fusioni e acquisizioni negli ultimi anni, a grandi etichette di prezzo, come ad esempio Cisco $1.6 miliardi di acquisto nel febbraio dello scorso anno di IP-voice fornitore di Broadsoft.

copy-of-craig-headshot-july-18.png

Craig Walker, fondatore e amministratore delegato, ha venduto la sua ultima telefonia aziendale di Google, e corse la Voce di Google prodotto per diversi anni. Egli ritiene che l’applicazione di AI di assistenza al cliente e di vendita è l’ultima frontiera nella combinazione di software per il cloud e la telefonia aziendale.

Ma Walker ritiene che la sua azienda è la prossima frontiera della enterprise voice. L’azienda utilizza tecniche di machine learning per la miniera di dati della chiamata per intuizioni significative sul supporto e vendite.

“Abbiamo intenzione di creare un nuovo mercato, un sistema di vendita-la chiamata AI-migliorata del mercato”, dice Walker. “Pensiamo che la voce di intelligence è l’ultimo offline set di dati”, spiega. “Il più importante conversazioni con i clienti tramite telefono, non più di e-mail, e oggi, tutto ciò che è nel vapore.”

Per costruire questa nuova IA mercato, Dialpad un anno fa pagato 50 milioni di dollari per una data mining start-up chiamata TalkIQ. TalkIQ in grado di elaborare le chiamate in tempo reale l’utilizzo di un automatico riconoscimento vocale, e l’elaborazione del linguaggio naturale programma. Si possono produrre modelli in chiamate anche con un rappresentante di vendita o assistenza clienti rep è la chiamata.

“Fuori di un’ora di conversazione, dire, siamo in grado di rompere le cose come, che Cosa è stato il sentimento di una conversazione? E possiamo farlo, non solo in tempo reale, mentre la chiamata sta accadendo, possiamo anche visualizzare la chiamata di agenti le informazioni sulla chiamata sullo schermo mentre si sta parlando.”

“E’ come quelli VH1 Pop-Up Video”, dice, facendo un po ‘ datato di riferimento per il canale musicale di utilizzo della parola palloncini per il commento sui video musicali indietro nel 1990.

Prima di Walker agganciato TalkIQ, una storia che era già prendendo forma presso l’azienda cinque anni fa su come la comunicazione vocale potrebbe rivoluzionare il front office.

In particolare, le aziende vogliono vedere call center in meno di un centro di costo, più di un modo per vendere un prodotto, un unico punto nel quale unificare le conversazioni con i clienti attuali e potenziali.

Per farlo comporterebbe lo spostamento da uno script basato su chiamate di funzione per una tecnologia che deriva approfondimenti in corso di moda.

“Il miglior prodotto telecom è quella che cuoce il discorso e l’elaborazione del linguaggio naturale in linea”, dice Dan O’Connell, chief strategist di Tastierino numerico, che è stato CEO di TalkIQ al momento della transazione.

“Che dovrebbe essere senza soluzione di continuità, mi basta fare una chiamata, e la magia accade.”

talkiq-oconnell-and-manderscheid-2019.jpg

Dialpad chief strategist di Dan O’Connell, a destra, e il capo di AI, Etienne Manderscheid, presso il Tastierino numerico sede a San Francisco, dove i classici telefoni decorare la porta d’ingresso. “Il miglior prodotto telecom è quella che cuoce il discorso e l’elaborazione del linguaggio naturale in linea”, dice O’Connell.

Per rendere la magia richiede un sacco di duro lavoro da parte della società testa di intelligenza artificiale, machine learning, Etienne Manderscheid, che era la testa della scienza di dati a TalkIQ. Che cosa l’azienda si riferisce a come “personalizzazione a scala” è la capacità di sintonizzare i dettagli della parola e del linguaggio algoritmi per i clienti e le industrie di là di ciò che macchina convenzionale di apprendimento offre.

In un certo senso, Manderscheid e il suo team sono all’avanguardia applicata AI, che fa tutto il lavoro sporco che fa le cose funzionano in pratica.

Si inizia con l’elaborazione del suono di una chiamata per estrarre il testo, in cui Mandersheid e il team hanno creato un custom di riconoscimento vocale del sistema. Molti leader, ASR in questi giorni, come il tipo integrato in smartphone, elaborare il segnale audio di una conversazione in un tasso di 44 khz. Che non funziona per una Polycom-tipo sala conferenze del sistema, che utilizza un 8-kilohertz di codifica. Così parte la sfida tecnica per TalkIQ era quello di eseguire il riconoscimento vocale all’interno di un 8-kilohertz dominio.

Inoltre: AI di avvio di Persone.ai ottiene 30 milioni di dollari da Andreessen Horowitz per liberare posto di lavoro fatica

Il software funziona sia la componente acustica del suono feed e la componente di lingua. “Si stanno mettendo le cose a livello linguistico, per aumentare certe parole che sono importanti per i clienti, come i nomi di aziende e prodotti”, spiega Mandersheid.

L’iniziale trascrizione del testo, Mandersheid e la squadra può aggiungere l’elaborazione con un grande modello di linguaggio come Google “BERT,” per ri-score e migliorare le trascrizioni.

Per produrre l’elaborazione del linguaggio naturale, e, in ultima analisi, comprensione del linguaggio, la squadra crea prima un “minimo vitale del prodotto,” o MVP, utilizzando metodi semplici come “espressioni regolari” prima di entrare in qualsiasi macchina di apprendimento di sviluppo.

È importante perché la creazione di una etichetta di formazione per l’apprendimento automatico può portare a un vicolo cieco.

“Per un sacco di elaborazione del linguaggio naturale, abbiamo imparato questo nel modo più duro”, dice Mandersheid. “Inizialmente, ci sarebbe costruire un etichettati training set, che è difficile da cambiare.”

Un tipico modello PNL come BERT “non ha un volante”, come gli piace metterlo. “All’inizio del lavoro con una molto agile team, è necessario disporre di un volante per scorrere veloce.”

Il processo di iterazione affina la etichettati training set per adattarsi a un determinato cliente. Che può richiedere diversi mesi una volta l’MVP è stato stabilito.

“Iniziamo con una semina modello, che dà un buon primo passo, e poi un modello come BERT ci può aiutare a generalizzare da lì”, dice Mandersheid. “È come l’apprendimento attivo: si utilizza un seme modello per generare la prima serie di positivi. Se siete stati di campionamento casuale, basta non avere abbastanza istanze [di un determinato token] per costruire un classificatore.”

Inoltre: AI startup InsideSales chiede se una macchina può essere insegnato a vendere

“Un sacco di manifestazioni più significative ci sono eventi rari”, spiega Mandersheid. “In considerazione quanto spesso un prezzo obiezione arriva” in una telefonata tra un rappresentante di vendita e una prospettiva. “Succede raramente, ma è significativo in termini di impatto sull’opportunità di vendita.

“Abbiamo dovuto trovare soluzioni a come raccogliere un numero sufficiente di esempi positivi per costruire un etichettati training set con tali casi rari.”

L’attento lavoro di costruzione di una voce e linguaggio combo si estende la parola “embedding” che macchina di apprendimento utilizza per rappresentare i suoni e il testo è in corso di elaborazione. Mandersheid e il team hanno sviluppato specifici del dominio personalizzato incorporamenti. Termini come “opportunità” per le vendite di dominio hanno un significato particolare, egli sottolinea, come “vicino”, il che significa, per concludere un affare.

Mandersheid Aggiunge che il mainstream lingua di modelli di machine learning, tra cui BERT e una più recente approccio, “XLNet,” non prendere in considerazione i segnali audio che vengono con l’elaborazione di discorso. Ma quelle stecche di “dare maggiore comprensione di ciò che accade in una chiamata, che abbiamo in programma di aggiungere al nostro incorporamenti in futuro.”

Anche: Avvio Clari spinge la velocità e la scala’ di AI per legare insieme dei dati aziendali

Mettere tutti i pezzi insieme, e il risultato è qualcosa di unico. “Da un geek prospettiva, siamo in grado di controllare l’intero tech stack di telefonia, attraverso ASR, alla PNL, end-to-end, e che porta con sé una grande precisione di vantaggio; non so di chiunque altro nel nostro spazio, facendo questo, oggi,” dice Mandersheid.

C’è una visione di un prossimo passo, spiega, una sintesi di tutte le parti in un unico, gigantesco modello. “Vorremmo, infine, di vedere un grande modello che è un senza soluzione di continuità modello per le parole, i momenti, le vendite risultati, e tutto il resto, in modo da evitare errori a cascata su molti livelli.”

Sembra che in retrospettiva, che era kismet che TalkIQ fiorente macchina approccio di apprendimento si fonde con Tastierino numerico cloud di telefonia approccio.

“Abbiamo avuto 20 dipendenti e 20 milioni di dollari in banca, ma era chiaro che questo doveva essere il futuro di telecom,” come O’Connell descritto il pensiero di TalkIQ quando Dialpad offerta è arrivato.

Argomenti Correlati:

Cloud

La Trasformazione Digitale

CXO

Internet delle Cose

L’innovazione

Enterprise Software