DUTCH

Mozilla releases dataset en het model tot lagere stem-herkenning barrières

142

Nul

Mozilla heeft haar Gewone Stem collectie bevat bijna 400.000 opnamen van 20.000 mensen, en wordt beweerd dat de tweede-grootste stem dataset voor het publiek beschikbaar.

De voice-samples in de collectie werden verkregen van Mozilla ‘ s Common Stem-project, waardoor gebruikers via een iOS-app of website te doneren hun uitingen. Het is te hopen dat het creëren van een grote openbare dataset zal zorgen voor een betere voice-enabled toepassingen.

“Een van de redenen dat enkele diensten zijn in de handel verkrijgbaar is, is een gebrek aan gegevens, de” Mozilla senior vice president van opkomende technologieën Sean White zei in een blog post.

“Startups, onderzoekers, of iemand anders die wil bouwen voice-enabled technologieën van hoge kwaliteit nodig hebt, getranscribeerd voice data op te leiden machine learning algoritmen. Nu, ze kunnen alleen toegang vrij beperkte datasets.”

Op het moment, de collectie is gericht op het engels, maar er zijn plannen om uit te breiden naar andere talen in de eerste helft van 2018.

Naast de dataset, Mozilla bracht ook de open-source Project DeepSpeech stem-herkenning model op basis van het werk gedaan door de Chinese internet-reus Baidu. Er wordt beweerd dat met zijn 6,5 procent fout-tarief op de LibriSpeech dataset, DeepSpeech is het naderen van de menselijke niveaus van erkenning.

In augustus, Microsoft zei dat het had bereikt, een stem-herkenning fout tarief van 5,1 procent op de Centrale corpus, hetzelfde niveau als een professionele menselijke transcribers.

Ondanks de nieuwe mijlpaal, Microsoft erkent dat de machines vind het nog steeds moeilijk om te erkennen de verschillende accenten en sprekende stijlen, en niet goed presteren in lawaaierige omstandigheden.

Eerder in het jaar, Google zei dat het had een 4,9 procent foutenpercentage in haar speech-recognition software.

Samsung heeft gezegd dat het op zoek is naar het gebruik van spraakherkenning in de home-appliance line-up in 2020, en onlangs samen met Kakao om samen te werken aan AI en spraakherkenning.

Verwante Dekking

Google inzetten op AI-eerst als computer vision, spraakherkenning, machine learning verbeteren

Op Google I/O, CEO Sundar Pichai zei dat alle van de onderneming en haar producten wordt vernieuwd te worden AI-eerste. De verschuiving kan worden groter dan de mobile computing.

Google Startpagina biedt nu ondersteuning voor meerdere accounts met spraakherkenning

Tot zes personen kunnen toegang krijgen tot hun accounts op de smart speaker, gewoon door te spreken.

Cisco introduceert de eerste spraakgestuurde assistent gebouwd voor vergaderingen

Terwijl de virtuele assistent steeds vaker voor, Cisco stelt de Vonk, Assistent zal de eerste zijn die echt bruikbaar in de enterprise space.

Microsoft hits nieuw record voor AI spraakherkenning (TechRepublic)

Microsoft onlangs in geslaagd een 5.1 procent word error rate voor de technologie voor spraakherkenning, bijpassende menselijke professionals en het instellen van een industrie mijlpaal.

Spraakherkenning gebruiken om de productiviteit te verbeteren op uw smartphone (TechRepublic)

Typen en vegen op een touch screen is de langzame manier om tekst in te voeren op een telefoon. In plaats daarvan, gebruik maken van spraak dicteren. Het is nauwkeuriger en sneller dan ooit tevoren.

Verwante Onderwerpen:

Open Source

CXO

Digitale Transformatie

Tech Industrie

Smart Cities

Cloud