Pētniecības datu publicēšana ir būtisks solis atvērtās zinātnes īstenošanā. Publicējot savus datus, pētnieki veicina caurspīdīgumu, reproducējamību un sniedz ieguldījumu plašākā zināšanu apritē.
Mūsdienās datu publicēšana kļūst par standarta praksi, ko arvien biežāk prasa finansētāji un zinātniskie žurnāli. Tā ir ne tikai ētiska atbildība pret zinātnieku kopienu, bet arī praktiska nepieciešamība, lai nodrošinātu pētniecības kvalitāti un uzticamību.
Efektīva datu publicēšana ietver piemērota repozitorija izvēli, atbilstošu licencēšanu, kvalitatīvu metadatu sagatavošanu un sensitīvo datu aizsardzības pasākumu ievērošanu. Pareizi publicēti dati kļūst par nozīmīgu zinātnes resursu, kas kalpo ne tikai pašiem pētniekiem, bet arī plašākai zinātniskajai kopienai.
DataverseLV – primārā izvēle
Pētniecības datus un/vai metadatus ievietojiet datu repozitorijā DataverseLV. DataverseLV tiek nodrošināta kvalitātes kontrole – datu kuratori pārbauda katru ievietoto datu kopu, izvērtējot metadatu pilnību un datu struktūru. Tikai pēc pārbaudes datu kuratori publisko datu kopas. Šāda kontrole nodrošina, ka publicētie dati atbilst FAIR principiem un ir piemēroti atkārtotai izmantošanai.
Alternatīvi repozitoriji
Ja nepieciešams, datus var publicēt citā piemērotā pētniecības datu repozitorijā. Svarīgi: Ja datus publicē citā pētniecības datu repozitorijā, tad DPP jāiekļauj repozitorija izvēles pamatojums!
Kad var izmantot citus repozitorijus:
- nozares specifiskas prasības – jomā pastāv specializēts repozitorijs (piemēram, GenBank bioloģijai, ICPSR sociālajām zinātnēm);
- finansētāja prasības – projekta līgums prasa izmantot konkrētu repozitoriju;
- starptautiskā sadarbība – partneri izmanto citu repozitoriju (piemēram, Zenodo, Figshare, Dryad);
- īpaši datu formāti – repozitorijs atbalsta specifiskus datu tipus.
Obligātie kritēriji citu repozitoriju izvēlei:
FAIR principu atbilstība – repozitorijs nodrošina, ka dati ir atrodami (ar meklēšanas funkcijām), pieejami (ar skaidriem piekļuves nosacījumiem), sadarbspējīgi (saderīgi ar citām sistēmām) un atkārtoti izmantojami (ar pilnīgiem metadatiem);
- ilgtermiņa saglabāšana (vismaz 10 gadi) – repozitorijs garantē datu drošu uzglabāšanu un pieejamību ilgtermiņā, pat ja mainās tehnoloģijas vai organizācija;
- pastāvīgo identifikatoru piešķiršana – repozitorijs automātiski piešķir DOI (Digital Object Identifier) vai citu pastāvīgo identifikatoru (PID), kas ļauj datus uzticami citēt zinātniskajās publikācijās un nodrošina stabilu atsauci, pat ja dati tiek pārvietoti.
Dati repozitorijā var tikt publicēti dažādos pieejamības līmeņos, ļaujot pētniekiem izvēlēties piemērotāko risinājumu atkarībā no datu rakstura, sensitīvitātes un juridiskajām prasībām:
- atvērtie dati – brīvi pieejami ikvienam bez ierobežojumiem. Tos var uzreiz lejupielādēt, izmantot un izplatīt bez maksas, ievērojot norādītos licenču nosacījumus. Šis ir vēlamākais variants atvērtās zinātnes kontekstā.
- ierobežotas piekļuves dati – pieejami ar īpašiem nosacījumiem, piemēram, reģistrējoties vai pieprasot piekļuves atļauju no datu kopas īpašnieka. Šāda pieeja piemērota gadījumos, kad nepieciešama kontrole pār datu izmantošanu.
- slēgtie dati – nav publiskā lietošanā un ir pieejami tikai ierobežotam personu lokam. Tomēr var izveidot metadatu ierakstu repozitorijā par slēgtajiem datiem, lai informētu citus pētniekus, ka šāda datu kopa eksistē.
- embargo periods – dažkārt pētnieki izvēlas noteikt embargo periodu, kas nozīmē, ka kādu noteiktu laika posmu dati nav publiski pieejami, bet nākotnē tie tiks atvērti. Šāds ierobežojums var būt saistīts ar autortiesībām, intelektuālā īpašuma aizsardzību vai publikāciju prasībām. Embargo periodam nevajadzētu pārsniegt 1-2 gadus pēc projekta beigām.
Licence ir juridisks dokuments, kas nosaka, kā citi drīkst izmantot, koplietot, pārveidot vai izplatīt publicētos datus. Bez licences citiem nav juridiskas skaidrības par to, vai un kā datus drīkst izmantot – tas var apturēt datu izmantošanu un samazināt to zinātnisku vērtību. Piemērota licence nodrošina gan autoru tiesību aizsardzību, gan skaidrus noteikumus citiem pētniekiem.
Creative Commons (CC) licences:
Licences izvēle
Licenci izvēlieties, balstoties uz datu raksturu, sensitivitāti un vēlmi kontrolēt to izmantošanu. Jo atvērtāka licence, jo vieglāk datus izmantot un citēt. Lai palīdzētu noteikt pētnieciskajiem rezultātiem vispiemērotāko licences veidu, variet izmantot tiešsaistes licences izvēles palīgrīku.
Sensitīvi dati nav piemēroti tiešai publicēšanai. Ja nepieciešams padarīt datus pieejamus plašākai zinātnieku kopienai, var izmantot anonimizāciju (datu dzēšanas, vispārināšanas, mikroagregācijas vai sajaukšanas metodes), izveidot reducētas datu versijas ar samazinātu detalizāciju, kas nesatur identificējošu informāciju, vai repozitorijā publicēt tikai metadatus ar informāciju par datu eksistenci un piekļuves iespējām.
Šāda pieeja ļauj ievērot atvērtās zinātnes principus, vienlaikus aizsargājot konfidencialitāti un ievērojot juridiskās prasības. Tā nodrošina līdzsvaru starp zinātnieku vajadzību pēc datu pieejamības un pētījuma dalībnieku privātuma aizsardzību, kā arī saglabā pētījumu reproducējamību.
Lai dati būtu pilntiesīgi zinātnisks resurss, tiem jābūt citējamiem tāpat kā publikācijām. Publicējot datus uzticamā repozitorijā, tiem tiek piešķirts pastāvīgs identifikators (parasti DOI), kas ļauj tos ērti citēt.
Standarta datu citēšanas formāts: Autors(i) (gads). Datu kopas nosaukums. Repozitorija nosaukums. DOI |
Piemērs: Paura, L., Arhipova, I., Vitols, G., Sproge, S. (2025). Higher education students’ entry characteristics and students’ dropout. DataverseLV. https://doi.org/10.71782/DATA/X7CWTH v1 |
Ieteikumi datu citēšanai:
- norādiet autorus (vai institūciju), nosaukumu, publicēšanas gadu, repozitoriju, DOI vai citu identifikatoru;
- ja iespējams, miniet arī datu versiju (piemēram, v1.2), jo dati var mainīties;
- datu citēšanu bieži prasa finansētāji un žurnāli – iekļaujiet tos arī publikācijas atsauču sarakstā.
Arvien biežāk starptautiskie zinātniskie žurnāli iekļauj datu pieejamības deklarāciju jeb paziņojumu (angliski: data availability statement) kā atsevišķu zinātniskā raksta sadaļu. Šis paziņojums norāda, vai un kā pētniecības dati ir pieejami citiem pētniekiem.
Piemēri datu pieejamības deklarācijās:
publiski pieejami dati | “Visi pētījumā izmantotie dati ir pieejami publiski, un tos var atrast DataverseLV repozitorijā ar šādu DOI: ...” |
dati pēc pieprasījuma | “Dati pieejami pēc pieprasījuma, sazinoties ar zinātniskā raksta atbildīgo autoru.” |
ierobežoti dati | “Datu kopa satur sensitīvu informāciju un nav publiski pieejama. Metadati un datu apraksts pieejami DataverseLV repozitorijā.” |
- Izmantojiet datu repozitoriju DataverseLV kā pirmo izvēli;
- Dokumentējiet alternatīvas – ja izmantojat citu repozitoriju, pamatojiet izvēli DPP;
- Publicējiet datu kopas pēc iespējas ātrāk un ievērojiet principu “tik atvērti, cik iespējams, tik ierobežoti, cik nepieciešams”;
- Sagatavojiet kvalitatīvus metadatus – bagātīgs apraksts uzlabo datu atrodamību un izmantojamību;
- Izmantojiet standarta formātus – .csv, .xml, .tiff un citi atvērti formāti nodrošina ilgtermiņa pieejamību;
- Pievienojiet ReadMe datni – detalizēts apraksts palīdzēs citiem saprast un izmantot datus;
- Konsultējieties ar datu kuratoriem – rakstiet uz e-pastu datu.kuratori@lu.lv par jebkādu pētniecības datu pārvaldības jautājumu.