LU MII uzsāktais projekts SemTi-Kamols ir veltīts semantiskā tīmekļa tehnoloģiju un latviešu valodas mijiedarbības izpētei un attīstīšanai, ar mērķi sekmēt vismodernāko informācijas un valodas tehnoloģiju strauju un sekmīgu attīstību Latvijā.

Izklāstītas ir gan teksta semantikas automātiskas izgūšanas principiālās nostādnes, gan arī jau šobrīd projektā paveiktais, attīstot labākās leksisko ontoloģiju WordNet un OntoSem arhitektūras idejas, pusautomātiski formalizējot latviešu valodas leksikonu (skaidrojošo vārdnīcu) un sastatot to ar ontoloģijas konceptiem. Rezultātu novērtēšanai ir izstrādāts eksperimentāls analizators, kas, izmantojot gramatikas likumus, leksikonu un ontoloģiju, spēj formāli reprezentēt ierobežotas sintakses latviešu valodas teikumu nozīmi. Atslēgas vārdi: semantiskais tīmeklis, dabīgās valodas analīze, ontoloģija, leksikons, teksta nozīmes reprezentācija. Rezultāti un secinājumi, nākotnes ieceres Galvenie rezultāti šobrīd ir: uzlabota un attīrīta OntoSem ontoloģija, pārveidota OWL-DL formā, latviešu valodas leksikona (skaidrojošās vārdnīcas) formalizēšana semantiskā tīmekļa vajadzībām, nozīmju unikāla identificēšana oriģināli izveidotajā URI formātā, 1000 vispārīgāko un arī biežāk lietoto latviešu valodas vārdu nozīmju manuāla piesaiste ontoloģijas konceptiem. Tāpat ir izveidota un publiski pieejama pilotaplikācija ierobežotu latviešu valodas teikumu automātiskai transformēšanai formālā jēgas reprezentācijā (OWL formātā), starpvalodā, kas demonstrē semantiskā tīmekļa tehnoloģiju potenciālās iespējas. Eksperimentālās programmatūras iestrādes semantisko relāciju izguvē un leksisko taksonomiju konstruēšanā no mašīnlasāmas skaidrojošās vārdnīcas ir devušas pietiekami daudzsološus rezultātus, lai attīstītu pētniecību un izstrādi šajā virzienā. Projekta noslēguma gadā līdztekus SemTi-Kamols latviešu valodas datorizētas analīzes rīka un „Semantiskās Latvijas” tehnoloģiju pilnveidošanai liela uzmanība tika veltīta projekta pamatmērķa tuvināšanai — tekstā ietvertās semantikas formalizēšanai. Visās minētajās jomās ir izdevies sasniegt plānotos rezultātus. Daļa no šiem rezultātiem jau šobrīd tiek ieviesti tautsaimniecībā (medicīnā, valsts pārvaldē, latviešu risināmo problēmu un metodisko uzlabojumu. Būtisks ieguvums ir manuāli izveidotā un ontoloģijai piesaistītā leksikona augšējā līmeņa taksonomija, kuru korekti automatizēti piesaistīt būtu neiespējami, bet ar kuras palīdzību būs iespējams automatizēti un ar augstāku precizitāti pievienot un organizēt dziļākus leksikona līmeņus. Liels darbs ir veikts dažādu esošo semantiskā tīmekļa tehnoloģiju un rīku izmantošanas iespēju izpētē latviešu valodas un projekta situācijas vajadzībām. Tieši loģiskie izvedumi (un līdz ar to automātiskas secināšanas līdzekļu atbalsts) ontoloģijā, leksikonā un faktu krātuve nākotnē sniegs vislielāko ieguvumu un izsmalcinātākās informācijas analīzes iespējas latviešu valodā. Taču no teorētiski pamatotas līdz praktiski lietderīgai latviešu valodas semantiskā tīmekļa sistēmai vēl ir nepieciešams veikt ne tikai kvantitatīvus uzlabojumus, bet arī iekļaut kvalitatīvus leksisko un pasaules zināšanu avotus un komplicētus tekstu strukturālās un gramatiskās analīzes rīkus. Projekta turpinājumā tiks izstrādāts pēc iespējas pilnīgāks latviešu valodas „precīzo” teikumu sintaktiskais un semantiskais metamodelis, kas sekmēs dažādu semantiskā tīmekļa aplikāciju izveidi un ieviešanu Latvijā. Visas iespējamās lietojuma sfēras šobrīd ir grūti paredzēt, taču kvalitatīva tulkošana no/uz latviešu, angļu u. c. valodām, kvalitatīvāku informācijas meklētājprogrammu attīstīšana semantiskā tīmekļa videi, pretrunu meklēšana dažādos juridiskos tekstos (līgumi, likumi) u. tml., ir tikai daži no piemēriem. Viena no projekta pēdējās fāzes iecerēm ir uz semantiskā tīmekļa balstītas nākotnes e-Latvijas koncepcijas izstrāde. Tās mērķis ir nodrošināt semantiskā tīmekļa tehnoloģiju pieejamību citos e-Latvijas projektos. Tajā tiks izstrādāti virkne mazāku pilotprojektu, kas palīdzēs uzsākt šo tehnoloģiju praktisku izmantošanu citos projektos. Informācijas apmaiņas līmenī šis process jau ir uzsākts ar citiem Valsts pētījumu programmas „Informācijas tehnoloģijas” projektiem.

Dalīties