03 Sep

Mozilla mācīs datoriem saprast latviešu valodu

Firefox tīmekļa pārlūka izstrādātāji Mozilla ir nākuši klajā ar jaunu projektu Mozilla Common Voice. Projekta mērķis ir savākt balss ierakstus dažādās valodās no dažādiem cilvēkiem, lai pēc tam tos apkopotu brīvi pieejamā datu kopā, ko dažādi izstrādātāji var izmantot savos produktos.

Balss ir dabisks veids kā sazināties un nodot informāciju. Ja datoram, nākotnes pašbraucošajām mašīnām un robotiem varētu vienkārši pateikt ko mēs gribam, tehnoloģiju lietošana būtu vienkārša un patīkama. Common Voice mērķis ir izveidot balss atpazīšanas tehnoloģiju, kuru varētu lietot dažādās ierīcēs. Bet, lai radītu šādu balss tehnoloģiju, ir nepieciešams liels balss ierakstu skaits. Pasaules lielajās valodās šādi ieraksti ir savākti un tehnoloģijas ir pieejama, bet līdz šim tādas mazās valodas kā latviešu par iespēju sazināties ar iekārtām balss režīmā varēja tikai sapņot.


Common Voice mājas lapā ikviens brīvprātīgais var ierakstīt īsus balss ierakstus. Lapa strādā arī no mobilajām iekārtām. Lai dalībniekiem būtu interesantāk darboties lapā ir iestrādāti spēles elementi. Dalībnieki var sacensties topā par to kurš kopējam mērķim ir izdarījis visvairāk.

Lai balss atpazīšanas tehnoloģija darbotos ļoti labi ir nepieciešams liels skaits dažādu balsu ierakstu, tāpēc ir svarīgi, lai savas balsis ziedotu dažādu vecumu, dzimumu un reģionu cilvēki.

Ierunājamie tekstiņi ir veidoti no latviešu sakāmvārdiem un dažādām ikdienas frāzēm populārās filmās. Jaunu ierunājamo tekstu pievienošana tāpat kā ierunāto tekstu pārbaude ir lapas lietotāju kopienas pārziņā.

Šis ir interesants veids kā arī ne programmētāji var iesaistīties jauno tehnoloģiju izstrādē un nodrošināt to, ka latviešu valoda būs aktuāla arī nākotnē.

Balss atpazīšanas tehnoloģiju nākotnē varētu izmantot, lai sazinātos ar digitālakiem asistentiem, kā piemēram Amazon Alexa vai Google Home. Satiksmes drošība uzlabotos, ja nākotnes mašīnai mēs varētu vienkārši palūgt pārslēgt dziesmu, nomainīt navigācijas galamērķi vai izslēgt gaisa kondicionieri. Ja datori saprastu latviešu valodu mēs varētu meklētājā ierakstīt frāzi un uzreiz atrast precīzu sekundi kādā no Latvijas Televīzijas vēsturiskajiem ziņu sižetiem vai precīzi sameklēt to runu kur kāds politiķis ir solījis kādu svarīgu lietu.

Share this