SVENSKA

Mozilla släpper dataset och modell att lägre röst-erkännande hinder

133

Noll

Mozilla har släppt sin Gemensamma Röst samling, som innehåller nästan 400,000 inspelningar från 20 000 människor, och påstås vara den näst största röst dataset tillgängliga för allmänheten.

Rösten prover i samlingen erhölls från Mozilla Gemensamt projekt, som tillät användare via en iOS-app eller webbplats för att donera sina yttranden. Förhoppningen är att skapa en stor offentlig dataset kommer att möjliggöra en bättre röst-aktiverade program.

– En anledning till att så få tjänster som finns tillgängliga i handeln finns en brist på data”, Mozilla senior vice president för ny teknik Sean White sa i ett blogginlägg.

“Att starta företag, forskare eller någon annan som vill bygga röst-aktiverade teknik behöver hög kvalitet, transkriberat tal uppgifter att träna machine-learning algoritmer. Just nu, de kan bara komma åt ganska begränsade datamängder.”

Just nu kollektion är fokuserad på engelska, men det finns planer på att utvidga det till andra språk under första halvåret 2018.

Vid sidan av sitt dataset, Mozilla släppte också sin open-source-Projekt DeepSpeech röst-erkännande-modell baserad på arbete som utförts av Kinesiska internet jätte Baidu. Det påstås att med sina 6,5 procent fel priser på LibriSpeech dataset, DeepSpeech närmar sig mänskliga nivåer av erkännande.

I augusti, Microsoft sa att det hade nått en röst erkännande fel på 5,1 procent på Växel corpus, samma nivå som professionella mänskliga avskrivare.

Trots ny milstolpe, Microsoft erkänner att maskiner som fortfarande tycker att det är tufft att känna igen olika accenter och tala stilar, och inte fungerar bra i bullriga förhållanden.

Tidigare i år, sade Google det hade 4,9 procent fel i sin programvara för röstigenkänning.

Samsung har sagt att det är ute efter att använda röstigenkänning under hela sitt hem apparaten line-up till 2020, och nyligen samarbetat med Kakao för att samarbeta på AI och röstigenkänning.

Relaterade Täckning

Google satsar på AI-först som datorseende, röstigenkänning, maskininlärning förbättra

På Google i/O, VD Sundar Pichai att alla i företaget och dess produkter finns på att göras om för att vara AI-först. Övergången kan vara större än bärbara datorer.

Google Hem nu stöd för flera konton med röstigenkänning

Upp till sex personer kan komma åt sina konton på den smarta högtalare, helt enkelt genom att tala till det.

Cisco lanserar den första röststyrda assistent byggd just för möten

Medan virtuella assistenter blir allt vanligare, Cisco hävdar sin Gnista, som Assistent kommer vara den första som verkligen är användbara i företaget utrymme.

Microsoft slår nytt rekord för AI taligenkänning (TechRepublic)

Microsoft har nyligen uppnått en 5,1 procent word error rate för sin taligenkänning tekniken, matchande mänskliga proffs och inställning av en industri milstolpe.

Använda taligenkänning för att förbättra produktiviteten på din smartphone (TechRepublic)

Att skriva och dra på en touch-skärm är den långsamma sätt att mata in text på en telefon. Använd istället tal diktamen. Det är mer exakt och snabbare än någonsin tidigare.

Relaterade Ämnen:

Öppen Källkod

CXO

Digital Omvandling

Tech-Industrin

Smarta Städer

Cloud