11. marts, 2021

Top daudzvalodu mākslīgā intelekta platforma SELMA ziņu satura veidošanai un monitoringam

horizon

Latvijas Universitātes Matemātikas un informātikas institūts (LU MII) ir sācis līdzdalību Eiropas Savienības pētniecības un inovāciju programmas “Horizon 2020” projekta SELMA īstenošanā. Tā mērķis ir izveidot daudzvalodu atvērtā pirmkoda platformu un izstrādāt jaunas metodes mākslīgā intelekta valodas modeļu iegūšanai, izmantojot dziļo mašīnmācīšanos.

Pasaulē ik dienu tiek radīts milzīgs daudzums teksta un audiovizuāla satura. Valodu tehnoloģiju SELMA palīdzēs žurnālistiem un mediju analītiķiem pētīt un izprast šo apjomīgo satura plūsmu. Vienlaikus tiks veicināta daudzvalodu audiovizuālā satura veidošana un plašāka pieejamība, izmantojot automātisku runas transkribēšanu, mašīntulkošanu, subtitru ģenerēšanu un balss sintēzi.

SELMA konsorcija mērķis ir izveidot multilingvālu atvērtā pirmkoda platformu un izstrādāt jaunas metodes mākslīgā intelekta valodas modeļu iegūšanai, izmantojot dziļo mašīnmācīšanos. Platforma spēs apstrādāt 10 milj. satura vienību dienā, un tās mākslīgā intelekta komponentes tiks regulāri pilnveidotas, sistēmai turpinot pašmācīties. Valodu modelēšanā un apstrādē tiks izmantota jauna pieeja, kas ļaus saglabāt katrai valodai raksturīgās iezīmes – primāri apkopos un analizēs saturu oriģinālvalodā, nevis izmantos angļu valodu kā starpniekvalodu. Tulkošana un runas sintēze citās valodās tiks veikta pēc pieprasījuma.

Projekta konsorciju koordinē starptautiskās raidorganizācijas “Deutsche Welle” (DW) inovāciju nodaļa. Citi partneri ir Aviņonas Universitātes Datorzinātņu laboratorija LIA (Francija), valodu tehnoloģiju uzņēmums “Priberam” (Portugāle), Fraunhofera Intelektuālās analīzes un informācijas sistēmu institūts (Vācija).

LU MII dalība SELMA projektā (Nr. 957017) ir iespējama, pateicoties ilggadējai sadarbībai ar industrijas partneriem, ar kuriem kopīgi realizēti dažādi nacionāla un starptautiska līmeņa pētniecības un inovāciju projekti mākslīgā intelekta un dziļās mašīnmācīšanās jomās. Īpaši nozīmīga ir bijusi LU MII pēdējo gadu sadarbība ar nacionālo informācijas aģentūru LETA un Rīgas Austrumu klīnisko universitātes slimnīcu, īstenojot ERAF praktiskas ievirzes pētījumus “Dziļās mašīnmācīšanās modeļi un to dzīves cikla pārvaldības ietvars multimediju datu apstrādei ziņu aģentūrās” (Nr. 1.1.1.1/18/A/045) un “Latviešu valodas runas atpazīšana un sintēze medicīnas lietojumiem” (Nr. 1.1.1.1/18/A/153).

Padalies ar šo ziņu sociālajos tīklos

Jānis Alksnis

Esmu moderno tehnoloģiju entuziasts ar ilggadēju un plašu pieredzi dažādās informāciju tehnoloģiju jomās, ar savu skatījumu uz lietu kārtību.

Spiediet šeit, lai atstātu komentāru

Vieta komentāram


Piedāvātais serviss ietver diskusijas un komentārus, kas atļauj mijiedarboties lietotājiem. Vietnes autors nekontrolē ziņojumus, informāciju un failus, kas tiek piegādāti ziņojumu dēlim. Lietojot šo servisu Jūs piekrītiet sekojošiem noteikumiem:

  • Jūs nedrīkstat traucēt citus lietotājus, saskaņā ar LR civillikumu.
  • Aizliegts nosūtīt, publicēt jebkāda veida nelikumīgu, draudošu, aizskarošu, apmelojošu, neslavu ceļošu, neķītru, vulgāru, pornogrāfisku, zaimojošu un piedauzīga rakstura informāciju t.s. bildes.
  • Jūs nedrīkstiet nosūtīt, publicēt informāciju, programmas vai jebkāda veida materiālus, kas aizsargāti ar LR likumu par autortiesībām.
  • Aizliegts nosūtīt, publicēt datus, kas var saturēt datorvīrusus vai arī datus, kas var saturēt kaitīgas komponentes.
  • Jūs nedrīkstiet nosūtīt, publicēt materiālus, kuriem ir komerciāls raksturs, ja tā nav iepriekš saskaņota ar vietnes autoru.
  • Vietnes autors neatbild par rakstu komentāru saturu un aicina lasītājus būt tolerantiem, iztikt bez rupjībām un saglabāt elementāras pieklājības normas.
  • Vietnes komentāros ir aizliegta jebkāda veida politiskā reklāma un aģitācija. Šī noteikuma neievērošanas gadījumā var tikt liegta iespēja pievienot komentāru uz nenoteiktu laiku.

Noteikumu neievērošanas gadījumā:

  • Bloga autors patur tiesības dzēst lasītāja komentārus un liegt pieeju blogam, kā arī bloga autors patur tiesības izmantot komentāru saturu pēc saviem ieskatiem.

Ja netiek ievēroti augstāk minētie lietotāju noteikumi, tiek uzskatīts, ka ir pārkāptas autora tiesības un atkarībā no pārkāpuma rakstura vai sekām pārkāpējs saucams pie likumā noteiktās administratīvās vai kriminālās atbildības.

lvLatviešu valoda