Conversationele kunstmatige intelligentie dient als de interface tussen een persoon en een computer, waardoor organisaties boeiende wederzijdse interacties kunnen bereiken. De technologie wordt meestal geassocieerd met callcenters en virtuele assistenten/chatbots, hoewel het in vrijwel elke verticale branche kan worden toegepast. Dankzij machine learning en AI-doorbraken in de afgelopen jaren, is conversatie-AI verder gegroeid dan chatbots en omvat het een verscheidenheid aan gebruiksscenario's.
Conversational AI bestaat al een aantal jaren, maar de technologie is nog niet klaar voor iets anders dan een laboratorium. Maar dankzij de vooruitgang in AI-technologie, versneld computergebruik en modellen voor machine learning, is conversatie-AI klaar om de bedrijfswereld in te gaan als een reguliere technologie, met name op het gebied van klantervaring.
Eerder deze maand kwam een panel van experts van T-Mobile, RingCentral en Hugging Face bijeen op de NVIDIA 2021 GTC-conferentie om te bespreken hoe conversatie-AI hun bedrijven heeft verbeterd en om trends te delen die de toekomst van deze opkomende technologie vormgeven. Op de conferentie onthulde NVIDIA ook Riva Custom Voice, een nieuwe toolkit die kan worden gebruikt om aangepaste stemmen te creëren met slechts 30 minuten aan spraakopnamegegevens.
De innovatie rond stemsynthese en spraakgegevens zal “de manier veranderen waarop virtuele assistenten en chatbots verbinding maken en terugspreken”, zegt Kari Briski, NVIDIA's vice-president van softwareproductbeheer voor AI/HPC (high-performance computing). Er is een enorme kans om gegevens te gebruiken om nieuwe AI-modellen voor conversatie te bouwen die rekening houden met de accenten van mensen en verschillende audio-omgevingen, zoals luidruchtige coffeeshops en buitensportevenementen.
AI is in staat om zichzelf te leren
“In de toekomst zullen we zien dat AI zijn eigen gegevens definieert”, zegt Prashant Kukde, Assistant Vice-President Conversational AI bij RingCentral. Net zoals een achtergrondfilter een rommelige kamer vervaagt, zei Kukde, zou AI kunnen fungeren als een realtime achtergrondfilter om een accent te elimineren wanneer een niet-moedertaalspreker aan het praten is. Tegelijkertijd zou een persoon aan de andere kant het accent horen waarmee ze vertrouwd zijn. Dit concept van bidirectionele gespreks-AI is slechts één voorbeeld van innovatie in deze ruimte, zei Kukde.
Door een stap terug te doen naar het heden, richt RingCentral zich momenteel op het toepassen van AI op spontane gesprekken die typisch zijn voor virtuele vergaderingen. De aanbieder van unified communications as a service (UCaaS) bundelt conversatie-AI in zijn bestaande productportfolio. Het heeft onlangs een nieuwe geautomatiseerde samenvattingsfunctie gelanceerd die spraak-naar-tekst samenvattingen van vergaderingen genereert om deelnemers een betere ervaring te bieden en op zijn beurt de productiviteit te verbeteren.
Waarom dit in elk contactcenter zou moeten zijn
Terwijl de conversatie-AI-implementaties van T-Mobile variëren van het ondersteunen van T-Mobile-medewerkers tot extern gerichte klanten. T-Mobile gebruikt AI in zijn contactcenters om gesprekken tussen klanten en klantenservicemedewerkers te documenteren, zowel via chatbots als selfservice. De draadloze provider gebruikt ook AI om gesprekken van spraak naar tekst te transcriberen om agenten die in callcenters werken te helpen (agent-assist).
Toen COVID-19 toesloeg, werden de callcenters van T-Mobile overspoeld met verzoeken van klanten om betalingsplannen vanwege de financiële moeilijkheden veroorzaakt door de pandemie. T-Mobile heeft deze simpele taak kunnen automatiseren door een chatbot uit te rollen die klanten hielp bij het maken van betalingsregelingen. Wat T-Mobile niet had verwacht, is zo'n hoog rendement op de investering (ROI) te krijgen door een klein nevenproject te lanceren, dat uitgroeide tot een veelgebruikte tool.
“We dachten dat de chatbot alleen tijdens het coronavirusseizoen zou leven. Maar in de eerste 18 maanden van zijn leven hadden we een ROI van 750 procent van deze chatbot”, zegt Heather Nolis, de belangrijkste machine learning-ingenieur van T-Mobile. “Er zijn veel routinetaken die plaatsvinden in onze callcenters waar mensen niet nodig zijn. We hebben zelfs ontdekt dat ongeveer 30 procent van onze klanten niet met een persoon wil praten en liever een gespreksassistent zou hebben.”
Conversationele AI zet zijn snelle evolutie voort
In de afgelopen drie jaar is conversatie-AI geëvolueerd met nieuwe soorten modellen die betere voorspellingen bieden om tekst samen te vatten en te classificeren, sentiment te begrijpen en nieuwe dingen te doen, zowel in spraak als in beeld. In de toekomst zal conversatie-AI worden aangedreven door open samenwerking via modellen, controlepunten en implementaties. Dit betekent dat organisaties meer pragmatische AI moeten omarmen, die het bedrijfsprobleem aanpakt in plaats van de oplossing, zegt Jeff Boudier, productdirecteur bij Hugging Face, maker van de Transformers open-source natural language processing (NLP)-bibliotheek.
“Een van de grootste uitdagingen van de afgelopen drie jaar was om de wetenschap in de handen van de beoefenaars te brengen,” zei Boudier. “Pragmatische AI vereist zoveel mogelijk gebruik van open source-technologieën. Dat is een van de bepalende kenmerken van machine learning, het is wetenschappelijk gedreven. Het is een levend systeem dat mensen bouwen.”
De Transformers-bibliotheek van Hugging Face stimuleert bijdragen van veel mensen in verschillende sectoren. Er zijn meer dan 1.600 openbare datasets beschikbaar in ongeveer 200 talen. Iedereen heeft toegang tot 70.000 gratis transformatormodellen, geleverd door een gemeenschap van 1.000 bijdragers (en groeiend). De datasets omvatten alles, van het classificeren van tekst tot het transcriberen van audio tot het herkennen van objecten in foto's en video's.
Een open, collaboratieve toekomst is het ultieme doel voor conversatie-AI. Maar voordat organisaties daar kunnen komen, moeten ze eerst begrijpen waarom ze chatbots en andere op AI gebaseerde services bouwen. RingCentral's Kukde vindt dat organisaties geleidelijk conversatie-AI moeten introduceren en deze zo moeten positioneren dat mensen niet het gevoel krijgen dat het hun werk overneemt. Wanneer AI geleidelijk wordt geïntroduceerd, hebben organisaties de tijd om feedback te verzamelen met meer gegevens, betere training en te blijven bouwen aan de toekomst, zei hij.
Nolis gelooft dat het een goede strategie voor organisaties is om chatbots te creëren die gebruikers van dienst zijn. met een goede ervaring in plaats van suggesties te doen die ze al kennen. Het is belangrijk om te begrijpen waar chatbots wel en niet moeten worden gebruikt, dus mensen houden er echt van om met chatbots te praten in plaats van ze te tolereren en te hopen dat ze uiteindelijk een echt persoon zullen bereiken.
“Iedereen die een chatbot bouwt, zou naar moeten luisteren hun gebruikers door te kijken naar de gegevens die ze al hebben van sociale media-interacties, klachten en gesprekken met klantenservicemedewerkers”, besluit Nolis. “Als de AI-agent die we bouwen niet kan doen wat een mens kan, dan laten we het aan een mens over, want we geven echt om de kwaliteit van onze klantenservice.”