Linux Foundation creëert standaarden voor spraaktechnologie met belangrijke partners

0
96

Jonathan Greig

Door Jonathan Greig | 22 juni 2021 — 17:30 GMT (18:30 BST) | Onderwerp: kunstmatige intelligentie

De Linux Foundation werkt samen met bedrijven als Target, Microsoft en Veritone om het Open Voice Network te creëren, een initiatief dat is ontworpen om “prioriteit te geven aan vertrouwen en standaarden” in spraakgerichte technologie.

Jon Stine, uitvoerend directeur van het Open Voice Network, vertelde ZDNet dat de snelle groei van zowel de beschikbaarheid als de acceptatie van spraakondersteuning wereldwijd – en het toekomstige potentieel van spraak als interface en gegevensbron in een door kunstmatige intelligentie aangedreven wereld – maakt het belangrijk dat bepaalde standaarden gemeenschappelijk worden ontwikkeld.

Apparaten en applicaties bevatten steeds meer spraakactivering en navigatiefuncties. Mike Dolan, senior vice-president bij de Linux Foundation, zei dat het netwerk een “proactieve reactie was op de bestrijding van diepe vervalsingen in op AI gebaseerde spraaktechnologie.”

“Voice zal naar verwachting een primaire interface naar de digitale wereld zijn, die gebruikers verbindt met miljarden sites, slimme omgevingen en AI-bots. Het wordt nu al in toenemende mate gebruikt naast slimme luidsprekers om toepassingen in auto's, smartphones en allerlei soorten huishoudelijke apparaten op te nemen. De sleutel tot de acceptatie van deze mogelijkheden door bedrijven en het comfort en de vertrouwdheid van de consument is de implementatie van open standaarden”, zei Dolan, eraan toevoegend dat de organisatie “enthousiast was om het onder het open bestuursmodel van de Linux Foundation te brengen om de gemeenschap te laten groeien en te effenen een weg vooruit.”

De non-profitorganisatie zei dat de open-sourcevereniging zich zou inzetten voor het promoten van open standaarden die de adoptie van AI-compatibele spraakassistentiesystemen ondersteunen.

Naast Target, Microsoft en Veritone zei de Linux Foundation dat het werkt met Schwarz Gruppe, Wegmans Food Markets en Deutsche Telekom.

Ryan Steelberg, president en mede-oprichter van Veritone, zei dat zelfregulering van het maken van synthetische spraakinhoud en gebruikt om de eigenaar van de stem te beschermen en vertrouwen te wekken bij de consument “van fundamenteel belang” is.

“Het hebben van een open netwerk via het Open Voice Network voor onderwijs en wereldwijde standaarden is de enige manier om gelijke tred te houden met de snelheid van innovatie en de vraag naar influencer-marketing,” zei Steelberg. “Veritone's MARVEL.ai, een Voice as a Service-oplossing, is er trots op samen te werken met OVN bij het ontwikkelen van de best practices om de voice-merken waarmee we werken in sport, media en entertainment te beschermen.”

Duizenden bedrijven en organisaties hebben spraakassistentiesystemen ontwikkeld die onafhankelijk zijn van de huidige spraakplatforms voor algemeen gebruik als een manier om diensten te stroomlijnen en de gebruikerservaring te verbeteren.

Vertegenwoordigers van de Linux Foundation zeiden dat het Open Voice Network de platforms zou ondersteunen door “standaarden en gebruiksrichtlijnen te leveren voor stemassistentsystemen die betrouwbaar, inclusief en open zijn”. De organisatie zal ook advies geven over stemspecifieke bescherming van de privacy van gebruikers en gegevensbeveiliging en manieren om stemassistenten interoperabel te maken tussen platforms.

“Spreken is menselijk, en spraak wordt snel de primaire interactiemodaliteit tussen gebruikers en hun apparaten en diensten thuis en op het werk”, zegt Ali Dalloul, algemeen directeur bij Microsoft Azure.

“Hoe meer apparaten en services open en veilig met elkaar kunnen communiceren, hoe meer waarde we ontsluiten voor consumenten en bedrijven in een breed spectrum van gebruiksscenario's, zoals Conversational AI voor klantenservice en commercie.”

De Linux Foundation vergeleek de inspanning met de open standaarden die in de begindagen van het internet werden geïntroduceerd en merkte op dat deze initiatieven hielpen bij het creëren van uniforme manieren voor websites om verbinding te maken en informatie uit te wisselen.

Spraakassistenten zijn nu afhankelijk van verschillende technologieën, waaronder automatische spraakherkenning, natuurlijke taalverwerking, geavanceerd dialoogbeheer en machine learning.

Steelberg voegde eraan toe dat spraaktechnologieën en interfaces binnen vijf jaar volledig geïntegreerd zouden zijn in de meeste digitale applicaties, apparaten en workflows. Naarmate deze verspreiding en acceptatie van spraak toeneemt, merkte hij op dat het absoluut noodzakelijk is dat organisaties zoals het Open Voice Network en andere deelnemende aanbieders en ontwikkelaars van spraaktechnologie ijverig blijven op het gebied van consumenten- en gegevensbescherming, evenals de bescherming van het handelsmerk, het auteursrecht en het gebruik van stemmen van mensen.

Volgens Steelberg begon spraaktechnologie rond 2011 met de introductie van Siri bij iPhone-gebruikers. Nu zei hij dat 1 op de 4 volwassenen in de VS een soort slimme luidspreker bezit, en onderzoeken hebben aangetoond dat bijna alle smartphonegebruikers binnen de komende twee jaar een of andere vorm van stemassistent zullen gebruiken.

Stine voegde toe dat uit gegevens van januari blijkt dat er wereldwijd ongeveer 3 miljard actieve gespreksagenten zijn en dat dit aantal naar verwachting zal stijgen tot 8,4 miljard in 2024. 

“Het aantal IoT-apparaten zoals slimme thermostaten, apparaten en luidsprekers geeft stemassistenten meer nut in het leven van een verbonden gebruiker”, zei Steelberg.

“Slimme luidsprekers zijn de belangrijkste manier waarop we zien dat spraak wordt gebruikt. Het begint daar echter pas. Veel experts uit de branche voorspellen zelfs dat bijna elke toepassing de komende vijf jaar op de een of andere manier spraaktechnologie zal integreren .”

Strategieën voor CIO's

Siri, Cortana, Alexa en Google Assistant zijn nog maar het begin: Voice is the future

Siri, Cortana, Alexa en Google Assistant zijn nog maar het begin: spraak is de toekomst

Vier manieren om het gebruik van spraaktechnologie voor uw bedrijf te verkennen.

Lees meer

Verwante onderwerpen:

Internet of Dingen Digitale Transformatie CXO Innovatie Enterprise Software Smart Cities Jonathan Greig

Door Jonathan Greig | 22 juni 2021 — 17:30 GMT (18:30 BST) | Onderwerp: Kunstmatige Intelligentie