Pētniecības datu pārvaldība ir mūsdienu zinātnes neatņemama sastāvdaļa, kas nodrošina pētniecības kvalitāti, integritāti un ilgtspējību. Tā ietver sistemātisku pieeju datu plānošanai, organizēšanai, uzglabāšanai, dokumentēšanai un koplietošanai visā pētniecības projekta dzīves ciklā.

Efektīva datu pārvaldība ne tikai atvieglo pašu pētniecības procesu, bet arī palielina rezultātu ticamību, nodrošina atbilstību starptautiskajiem standartiem un finansētāju prasībām, kā arī veicina zinātnisku sadarbību. FAIR principi – datu atrodamība, pieejamība, sadarbspējība un atkārtota izmantojamība – ir kļuvuši par mūsdienu pētniecības datu pārvaldības pamatu.

Šeit atradīsiet pamatjēdzienus un principus, kas nepieciešami, lai izprastu pētniecības datu būtību, to veidus un dzīves ciklu, kā arī FAIR principu nozīmi kvalitatīvā zinātniskā darbā.

Pētniecības dati ir jebkura informācija, kas savākta, novērota vai izveidota pētniecības projekta gaitā un tiek izmantota kā pamats pētniecības rezultātu iegūšanai un secinājumu izdarīšanai. Pastāv milzīga datu daudzveidība, un tie var pastāvēt dažādās formās un formātos:

  • Primārie dati (paša pētnieka vākti):
    • eksperimentu rezultāti – laboratorijas mērījumi, ķīmiskie analīžu dati, fizikālie testi;
    • interviju ieraksti – audio/video materiāli, transkripcijas, lauka piezīmes;
    • aptauju dati – anketu atbildes, statistiskie dati, demogrāfiskie rādītāji;
    • programmatūras kods - skripti datu apstrādei, algoritmi, programmu pirmkodi;
    • vizuālie materiāli – foto, video, skenējumi, mikroskopijas attēli;
    • mērījumu tabulas – sensoru dati, novērojumu protokoli, kalibrācijas dati;
    • paraugu dati – bioloģiski paraugi, ģeoloģiski materiāli, arheoloģiski atradumi.
  • Sekundārie dati (no citiem avotiem iegūtie):
    • statistikas dati;
    • arhīvu materiāli;
    • atvērtie dati datu portālos un pētniecības repozitorijos;
    • zinātniskās datubāzes – bibliogrāfiskie ieraksti, publikāciju katalogi, patentu reģistri 

Datu kopa ir kopums ar līdzīgiem vai saistītiem pētniecības datiem, kas sagrupēti pētniecības vajadzībām.

Pētniecības datu pārvaldība ir process, kurā sistemātiski tiek plānota, organizēta, uzglabāta, koplietota un saglabāta pētniecības laikā iegūtā informācija jeb dati. Pētniecības datu pārvaldības mērķis ir nodrošināt, lai dati būtu droši, atkārtoti izmantojami, pārskatāmi un atbilstu gan ētikas, gan juridiskajām prasībām.

Pētniecības datu pārvaldība ir cieši saistīta ar pētniecības projekta norisi, un abiem procesiem ir savstarpēji papildinoši dzīves cikli. Kā redzams attēlā, datu pārvaldības un pētījuma dzīves cikls ietver vairākus savstarpēji saistītus posmus, sākot no plānošanas līdz kopīgošanai/publiskošanai.

Diagramma - datu pārvaldības dzīves cikls un pētījuma dzīves cikls

Pētījuma plānošanas posmā tiek definēti pētījuma mērķi, izvēlēta metodoloģija un identificētas datu pārvaldības vajadzības. Pētījuma sagatavošanas fāzē tiek izstrādāti konkrēti instrumenti, sagatavoti nepieciešamie tehniskie risinājumi, organizēta datu vākšanas procedūra un sagatavots detalizēts datu pārvaldības plāns ar nepieciešamajām datu pārvaldības aktivitātēm.

Pētījuma veikšanas fāzē notiek aktīva datu ievākšana, pirmapstrāde un kvalitātes kontrole, paralēli nodrošinot drošu uzglabāšanu un sistemātisku organizāciju. Šajā fāzē ietilpst arī datu apstrādes un analīzes posms, kurā dati tiek transformēti, analizēti un interpretēti, vienlaikus veidojot nepieciešamo dokumentāciju un metadatus.

Pētījuma noslēguma fāzē rezultāti tiek publicēti, bet dati tiek novērtēti to turpmākās vērtības kontekstā – daļa tiek sagatavota publicēšanai un ilgtermiņa arhivēšanai, citi var tikt dzēsti, ja to saglabāšana nav nepieciešama.

Efektīva pētniecības datu pārvaldība prasa katram posmam atbilstošu plānošanu un īstenošanu, ņemot vērā gan projekta, gan datu specifiskās vajadzības. Tāpēc nav iespējams izstrādāt vienu universālu datu pārvaldības modeli, kas būtu piemērots visiem pētījumiem.

FAIR principi ir vadlīnijas, kas nosaka, kādiem jābūt pētniecības datiem:

  • atrodami (angliski: findable) – dati un to metadati ir viegli atrodami citiem pētniekiem un sistēmām;
  • pieejami (angliski: accessible) – dati ir pieejami, un piekļuves nosacījumi ir skaidri norādīti;
  • sadarbspējīgi (angliski: interoperable) – dati ir saderīgi ar citām sistēmām un datu kopām;
  • atkārtoti izmantojami (angliski: reusable) – dati ir sagatavoti tā, lai tos varētu atkārtoti izmantot nākotnē. 

FAIR principos uzsvērta mašīnlasāmība (t.i., skaitļošanas sistēmu spēja atrast, piekļūt, sadarboties un atkārtoti izmantot datus bez vai ar minimālu cilvēka iejaukšanos). Pieaugošā datu apjoma, sarežģītības un izveides ātruma dēļ arvien vairāk to apstrādē jāpaļaujas uz skaitļošanas atbalstu, tādēļ FAIR principu nodrošināšana kļūst arvien būtiskāka.