Semantisko filtru izveides pamati hierarhiskai meklēšanai vēsturisku tekstu datu bāzēs bibliotēkās

J. Šķilters
 

Projekta gaitā izveidota būtiski jauna metodoloģija hierarhiskās meklēšanas nolūkiem vēsturisku tekstu datubāzēs. Teorētiskais pamatpieņemums, kas ir saistošs vairākām iesaistītajām nozarēm (digitālā satura ārvaldībai, filozofijai, vēstures zinātnēm, teorētiskajām datorzinātnēm) ir tas, ka vēsturisks materiāls ir strukturēts notikumos nevis homogēnā lineārā un strukturāli arbritrārā veidā. Vēstures materiāls ir semantiski strukturēts un organizēts notikumos, kuri var ietvert apakšnotikumus. Šī metodoloģija paredz vēstures ekspertu grupas izveidi, kura noformē kritērijus konkrētu notikumu segmentēšanai. Vēsturiski segmentēts materiāls būtiski paātrinātu meklēšanu un piedāvātu psiholoģiski, kognitīvi un semantiski adekvātu hierarhiskās meklēšanas veidu.

Kopējā sistēmas arhitektūra pieņem, ka tiek izmantoti robusti, sintaktiski un no procesa viedokļa ātri pēc-OCR pilna teksta indeksēšanas mehānismi, kuru rezultāts pēc tam tiek pakļauts semantiskai analīzei, kura pamatā izpaužas kā vēstures ekspertu grupas izdarītā notikumu segmentēšana.

Latvijas kopējai digitālo resursu pārvaldībai šie rezultāti ir vitāli būtiski, jo paredzams, ka tuvākajā laikā būs ievērojams pilna teksta resursu pieaugums. Šajā projektā ir izstrādāta konkrēta metodoloģija, kas ir ne vien teorētiski adekvāta, bet arī praktiski pielietojama meklēšanas filtru efektīvā konstruēšanā.

Projekta metodoloģija paredz būtiskus uzlabojumus ne vien pilna teksta indeksētu resursu meklēšanā un pārvaldībā, bet arī elektroniski kataloģizētu resursu meklēšanā.

Projekta rezultātu praktisks pielietojums tiks izmēģināts LNB un Olive Software pilotprojekta ietvaros.

Projekta gaitā ir veiktas specifisku šī projekta aspektu prezentācijas un aprobācija semantikas kongresos Kārdifā un Diseldorfā (pēdējā kongresā ir veidota zvērsta stenda prezentācija).

Pētniecības projekta rezultāti apkopoti divos izvērsos aprakstos un metodoloģijas izklāstā.

2008.gadā notiks projekta dalībnieku piedalīšanas reprezentatīvās konferences ar projekta rezultātu tālāku prezentāciju.