Grāmatu plaukts
Foto: Toms Grīnbergs, LU

Vai zināt, kas ir stāvkundziņš? Kā jūs skaidrotu, ko nozīmē “cibric”? Lai apzinātu šos un vēl citus vārdus, no 20. janvāra elektroniskajā vārdnīcā “Tēzaurs” uzsākta sabiedrības iesaistes iniciatīva “Iesaki vārdu!”. Pirmās dienas laikā tika iesniegti vairāk nekā 30 ieteikumi, bet pirmajā mēnesī – jau vairāk nekā 1000. Pašlaik kopējais iesniegto ieteikumu skaits ir pārsniedzis 2200 vārdu.

“Tēzaura” komanda izsaka pateicību katram iniciatīvas dalībniekam un strādā pie ieteikumu izskatīšanas un jaunu vārdu vai to nozīmju ieviešanas vārdnīcas datos.

Vārdnīcas jaunākajā laidienā jau atrodami pirmie ieteikumos balstītie papildinājumi – gan jauni šķirkļi, tostarp, “tīmekļseminārs” un “koprade”, gan atsevišķas vārdu nozīmes (piemēram, šķirkļiem “siermaize” un “sigma”). Šīs un citas pārmaiņas atspoguļo un iemūžina latviešu valodas attīstību, lai “Tēzaurs” turpinātu būt visaptverošs valodas resurss, kas noderīgs jebkuram lietotājam. Iniciatīva “Iesaki vārdu!” ir daļa no Latvijas Zinātnes padomes finansētā fundamentāli lietišķo pētījumu projekta “Mūsdienīgas metodes latviešu valodas leksisko resursu pilnveidei”, kura mērķis ir pētīt un attīstīt jaunākās metodes vārdnīcu papildināšanā.

Lielā sabiedrības interese rāda, ka leksisko resursu pilnveide ir vērtīgs un aktuāls uzdevums un funkcija “Ieteikt vārdu” vārdnīcā ir uz palikšanu. Ieteikto vārdu un vārdu nozīmju skaits nepārtraukti aug, tāpēc tiek plānota sistemātiska datu apstrāde, lai “Tēzaura” leksikogrāfi varētu pienācīgi izskatīt ieteikumus, pārbaudīt to lietojumu Nacionālajā korpusu kolekcijā un izstrādāt tiem vārdnīcas definīcijas. Tāpat projektā tiks pētītas metodes, kā šo procesu paātrināt.

Lai ieteiktu vārdu, kas jāpievieno “Tēzauram”, lietotājam jādodas uz mājaslapu Tezaurs.lv, jāspiež poga “Ieteikt vārdu” un jāaizpilda neliela anketa. Anketā jānorāda ieteiktais vārds, aptuvens vārda nozīmes skaidrojums un lietojuma piemērs. Tāpat var ieteikt jaunas nozīmes vārdiem, kuri jau ir vārdnīcā. Iesniegto informāciju rūpīgi pārbauda un precizē Latvijas Universitātes Matemātikas un informātikas institūta Mākslīgā intelekta laboratorijas leksikogrāfi, un tikai pēc tam tā nonāk vārdnīcā.

Sabiedrība jau līdz šim ir varējusi iesaistīties “Tēzaura” veidošanā, bet šāda apjomīga sabiedriskās zinātnes iniciatīva notiek pirmo reizi.

Par Tēzauru

“Tēzaurs” ir plaša skaidrojošā un sinonīmu vārdnīca, kas Latvijas Universitātes Matemātikas un informātikas institūta Mākslīgā intelekta laboratorijā (AiLab) tiek izstrādāta kopš 20. gadsimta deviņdesmitajiem gadiem un joprojām tiek aktīvi pilnveidota. Vārdi, stabili vārdu savienojumi un to nozīmes “Tēzaura” šķirkļos pārsvarā kompilēti no vārdnīcām, enciklopēdijām, dažādām datubāzēm u.tml. – informācija iegūta no vairāk nekā 340 daudzveidīgiem avotiem. Šķirkļos, kas veido latviešu valodas leksisko tīklu, nozīmju dalījums ir būtiski pārstrādāts, balstoties Nacionālās korpusu kolekcijas datos.

“Tēzaura” veidotāju mērķis ir apkopot visus latviešu valodā lietotos vārdus un to nozīmes, kā arī pēc iespējas bagātināt šķirkļus ar papildu informāciju. Lielai daļai šķirkļu ir pieejamas locīšanas tabulas un automātiski atlasīti piemēri no Līdzsvarotā mūsdienu latviešu valodas tekstu korpusa. Biežāk lietoto vārdu nozīmes ir rediģētas un manuāli papildinātas ar piemēriem, saistītajām nozīmēm (t.sk. sinonīmiem, meronīmiem, hiponīmiem) un tulkojumiem (sk. AiLab leksikogrāfu komandas papildināto šķirkļu sarakstu).

“Tēzaurs” ir deskriptīva vārdnīca, kurā leksika tiek iekļauta neatkarīgi no valodas paveida, žanra vai lietojuma, tāpēc tajā var atrast arī apvidvārdus, novecojušus vārdus, rakstības variantus, nevēlamus vārdus, sarunvalodas vārdus, žargonvārdus u.tml. Daļai šķirkļu pievienotas arī norādes par cilmi vai komentāri par dažādiem valodas kultūras aspektiem.

“Tēzaurā” ir fiksēti arī daudzi ģeogrāfiskie nosaukumi, bet pagaidām plašāk nav iekļautas tādas nosaukumu grupas kā personvārdi, organizācijas u.tml.

Dalīties