Atklāta valodas tehnoloģiju platforma Hugo.lv

12. decembrī atklāta valsts pārvaldes valodas tehnoloģiju platforma Hugo.lv. Tā ietver jaunākos mākslīgā intelekta sasniegumus latviešu valodai – pasaules atzinību guvušas mašīntulkošanas sistēmas, runas atpazīšanas rīkus un Nacionālo terminu datubāzi.

Jaunā platforma nodrošina daudzveidīgu latviešu un citu valodu atbalstu e-pārvaldes pakalpojumiem. Tā ietver arī publiski pieejamus tulkošanas un balss apstrādes rīkus, ko var izmantot gan valsts pārvaldes darbinieki, gan jebkurš iedzīvotājs. Ar jauno platformu Latvija izvirzās par vadošo Eiropas valsti valodu tehnoloģiju lietojumā valsts pārvaldē.

“Latviešu valoda ir mūsu tautas nemateriālās kultūras vērtība,” norāda kultūras ministre Dace Melbārde. “Šobrīd dominē lielās pasaules valodas, tāpēc mazajām valodām ir jābūt digitāli stiprām, lai pārrobežu saziņā tās turpinātu pastāvēt. Platforma Hugo.lv ir būtiska latviešu valodas aizsardzībai interneta vidē, vienlaikus kalpojot par mūsdienīgu, inovatīvu risinājumu valsts pārvaldes sniegto pakalpojumu uzlabošanai.” Tāpat īpašu gandarījumu ministre pauž par uzsākto iniciatīvu latgaliešu rakstu valodas vārdu pareizrakstības rīka izveidē, kas projekta attīstības nākamajā posmā tiks integrēts platformā Hugo.lv.

Projekta īstenotājs un platformas Hugo.lv uzturētājs ir Kultūras informācijas sistēmu centrs (KISC). KISC direktors Armands Magone uzsver: “Platforma Hugo.lv padarīs mūsu valsts pārvaldi vēl efektīvāku un modernāku, tā apliecinās Latvijas konkurētspēju mākslīgā intelekta un tehnoloģisko inovāciju jomā. Mašīna joprojām neaizstās cilvēka intelektu, taču tā būs lielisks palīgs valodas kā vērtības saglabāšanā un mūsu savstarpējās saziņas uzlabošanā.”

Platformas izstrādi veicis valodu tehnoloģiju uzņēmums “Tilde”. Tildes valdes priekšsēdētājs Andrejs Vasiļjevs norāda: “Platformu Hugo.lv veidojām ar jaunākajām Tildes pētnieku izstrādātajām mašīntulkošanas tehnoloģijām – tā sauktajiem dziļajiem neironu tīkliem. Tie “mācās” latviešu valodu no ļoti liela datu apjoma – profesionālu tulkotāju tulkojumiem, balss paraugiem, audioierakstu atšifrējumiem. Tildes izstrādātais mašīntulks, kas ietverts platformā Hugo.lv, jau divus gadus pēc kārtas ir uzvarējis starptautiskajās mašīntulkošanas sacensībās WMT (tās mēdz dēvēt arī par mašīntulkošanas olimpiskajām spēlēm), apsteidzot Google, Microsoft un citu globālu spēlētāju piedāvātos risinājumus. Ar jauno platformu Latvija ir izvirzījusies par Eiropas līderi valodas tehnoloģiju izmantošanā valsts pārvaldes digitalizācijā. Platforma jau ir prezentēta Briselē, Stokholmā, Oslo, Kopenhāgenā, Tallinā un citur, jo arī citas valstis meklē risinājumus, kā stiprināt savas valodas digitālajā pasaulē.”

Starptautisku izcilību guvusi mašīntulkošanas tehnoloģija

Hugo.lv ir īpaši pielāgots risinājums valsts pārvaldes vajadzībām un nodrošina automatizētu tulkošanu latviešu, angļu un krievu valodā, izmantojot jaunākās neironu mašīntulkošanas tehnoloģijas, kas būtiski uzlabo tulkojumu kvalitāti. Ar Hugo.lv varēs tulkot tekstus, dokumentus, interneta lapas. Pakalpojums tiks integrēts arī vairāk nekā 200 valsts pārvaldes vietnēs – jau šobrīd tas ir iekļauts e-pakalpojumu portālā Latvija.lv un Valsts ieņēmumu dienesta EDS mājaslapā.

Dators prot runāt latviešu valodā

Attīstoties balss tehnoloģijām, platformā Hugo.lv ir iekļauti modernākie runas atpazīšanas un sintēzes rīki. Runas atpazinējs nodrošina runas pārvēršanu tekstā no iepriekš ierakstīta audiofaila vai diktēta teksta. Savukārt balss sintēze sniedz iespēju rakstīto tekstu izrunāt balsī. Šie rīki ne tikai paaugstina darba produktivitāti, bet arī nodrošina iespēju cilvēkiem ar vājredzību vai disleksiju piekļūt interneta informācijas resursiem un izmantot dažādus e-pakalpojumus.

Iespēja ikvienam iesaistīties latviešu valodas jaunradē

Šajā projektā ir izveidota plašākā latviešu valodas terminu datubāze “Latvijas Nacionālā terminu datubāze”, kurā ietilpst vairāk nekā 400 000 terminu šķirkļu. Datubāze ir pieejami mājaslapā termini.gov.lv. Lielākais terminu skaits attiecas uz informācijas tehnoloģijām, izglītību, mākslu un kultūru, kā arī militāro nozari.

Datubāze nodrošinās vienotas terminoloģijas lietošanu valsts pārvaldē, kā arī ļaus iedzīvotājiem iepazīties ar pareizu terminu lietojumu. Turklāt mājaslapā iedzīvotāji varēs arī iesaistīties latviešu valodas terminu jaunradē, balsojot par terminologu piedāvātajiem jaunvārdu variantiem.

Projekts īstenots divu gadu laikā. Tas ietver mašīntulkošanas sistēmas un tulkošanas atbalsta rīku izstrādi, runas atpazīšanas sistēmu, runas sintēzes sistēmu, daudzvalodu korpusa un tā pārvaldības rīku izstrādi, mobilās lietotnes teksta tulkošanai un izrunāšanai un Latvijas Nacionālās terminu datubāzes izveidi par kopējo summu 1,5 miljoni eiro, no kuriem 85% sedz Eiropas Savienības līdzfinansējums. Hugo.lv būtiski samazinās ārpakalpojumu nepieciešamību rakstisko tulkojumu veikšanai, tā ietaupot valsts pārvaldes finanšu un laika resursus. Kopš 2012. gada rakstisko tulkojumu ārpakalpojumiem valsts iestādes ir tērējušas vairāk nekā 8,5 miljonus eiro.

Informāciju sagatavoja:
Jānis Ziediņš
KISC projektu vadītājs
E-pasts: janis.ziedins@kis.gov.lv

Inga Tauriņa
E-pasts: inga@lejinasleiers.lv
Tel. nr.: 26 564 629