Mūsdienās kvalitatīvi dati ir veiksmīga pētījuma pamats. Katalogs ir izveidots kā praktisks ceļvedis akadēmiskajam personālam un studējošajiem, lai palīdzētu izvēlēties piemērotus datu avotus un efektīvi atrast nepieciešamās datu kopas (kopumu ar līdzīgiem vai saistītiem pētniecības datiem, kas sagrupēti pētniecības vajadzībām) saviem pētījumiem.

Katalogs aptver gan lokālos Latvijas datu avotus, gan starptautiskos repozitorijus, piedāvājot strukturētu pārskatu par pieejamajām iespējām. Katrs datu avots ir papildināts ar konkrētiem piemēriem un praktiskiem padomiem, lai atvieglotu datu meklēšanas procesu.

Atvērtie dati ir kļuvuši par mūsdienu zinātnes neatņemamu sastāvdaļu, padarot pētniecību caurskatāmāku, sadarbībā balstītāku un efektīvāku. Tie ir brīvi pieejami dati, kurus pētnieki un studenti var iegūt, analizēt un izmantot savos projektos bez juridiskiem vai finansiāliem ierobežojumiem.

Datu repozitoriji darbojas kā digitālās bibliotēkas, kurās šie dati tiek profesionāli uzglabāti, organizēti un padarīti viegli atrodami. Tie nodrošina ne tikai drošu datu glabāšanu, bet arī to ilgtermiņa pieejamību un kvalitātes kontroli. Atkarībā no specializācijas, repozitoriji var fokusēties uz konkrētām zinātnes nozarēm (piemēram, medicīnas dati) vai piedāvāt universālu platformu dažādu jomu pētījumu materiāliem.

 

Zinātniskās publikācijas un tām piesaistītās datu kopas

Zinātniskās publikācijas ir vērtīgs resurss ne tikai jaunu atziņu iegūšanai, bet arī kvalitatīvu datu kopu atklāšanai. Zinātnes standarti aizvien biežāk prasa, lai pētnieki publisko savos pētījumos izmantotos datus, tādējādi veicinot pētījumu reproducējamību (iespēja atkārtot pētījumu, izmantojot tos pašus datus un metodes) un caurskatāmību.

Prestižie zinātniskie žurnāli (piemēram, Nature, Science, PLOS ONE) tagad bieži prasa obligātu datu pieejamības paziņojumu (Data Availability Statement), kurā autori norāda, kur un kā var piekļūt pētījuma datiem. Šie dati var būt pieejami:

  • repozitorijos: saites uz Zenodo, Figshare, Dryad vai nozares specifiskiem repozitorijiem;
  • žurnāla papildmateriālos: Excel vai CSV faili kā raksta pielikumi;
  • autoru rīcībā: kontaktinformācija datu pieprasīšanai;
  • institūciju vietnēs: universitāšu vai pētniecības centru datu platformās.

Praktisks padoms: Meklējot literatūru savā pētniecības jomā, pievērsiet uzmanību sadaļām "Methods", "Data Availability" vai "Supplementary Materials" – tās bieži satur atsauces uz vērtīgām datu kopām, kuras varētu izmantot arī jūsu pētījumos.

 

Google Dataset Search

Specializēta meklētājprogramma, kas palīdz atrast publiski pieejamas datu kopas visā internetā. Šis rīks ir ļoti noderīgs, jo ļauj meklēt datus pēc tēmas, formāta vai avota. Tas meklē datu kopas dažādos repozitorijos un institūciju vietnēs internetā. Google Dataset Search ir ideāls sākumpunkts jebkurai datu meklēšanai. 

Praktisks padoms: Sāciet ar plašiem, vispārīgiem terminiem angļu valodā (piemēram, "education statistics" vai "climate data"), pēc tam konkretizējiet ar papildu filtriem. Izmantojiet arī ģeogrāfiskos terminus – "Latvia", "Europe" – lai atrastu reģionāli specifiskus datus.

https://datasetsearch.research.google.com/

 

Datu repozitoriji

Datu repozitoriji ir speciāli veidotas platformas, kurās tiek uzglabātas un kopīgotas datu kopas. Repozitoriji piedāvā daudz vairāk nekā vienkārša failu glabāšana – tie nodrošina metadatu pārvaldību, versiju kontroli, citējamību ar DOI numuriem un integrāciju ar citiem zinātnes rīkiem.

Repozitoriji dalās divās kategorijās: 

  • vispārējie repozitoriji, piemēram, Zenodo un Figshare, pieņem datus no jebkuras zinātnes nozares un piedāvā plašas funkcionalitātes. Zenodo ir Eiropas Savienības finansēts repozitorijs, kas īpaši populārs ar savu GitHub integrāciju un bezmaksas DOI piešķiršanu. Figshare savukārt piedāvā gan privātas, gan publiskas kolekcijas un ir pazīstams ar lietotājam draudzīgu interfeisu;
  • specializētie repozitoriji fokusējas uz konkrētām zinātnes nozarēm vai datu tipiem. Dryad specializējas ekoloģijas un evolūcijas datos, bieži sadarbojoties ar zinātniskajiem žurnāliem datu publicēšanas prasību izpildē. Kaggle ir orientēts uz mašīnmācīšanos un datu zinātni, piedāvājot ne tikai datu kopas, bet arī aktīvu kopienu un sacensības. GenBank bioloģijā un ICPSR sociālajās zinātnēs ir kļuvuši par nozaru standartiem ar augstiem kvalitātes un dokumentācijas kritērijiem.

Kvalitatīvi repozitoriji piedāvā datus kopā ar strukturētiem metadatiem, kas ietver tehnisko informāciju par datu formātu un struktūru, metodisko informāciju par datu vākšanas procesu un juridisko informāciju par licencēm un izmantošanas noteikumiem. Šie metadati ir būtiski, lai pētnieki varētu efektīvi analizēt un reproducēt pētījumus.

Piekļuves iespējas datu kopām var ievērojami atšķirties. Atvērtā piekļuve ļauj uzreiz lejupielādēt datus bez reģistrācijas, parasti ar Creative Commons licencēm. Citi repozitoriji var prasīt bezmaksas reģistrāciju vai pat autoru atļauju, īpaši sensitīvu vai personīgu datu gadījumā. Dažos gadījumos kvalitatīvi vai ekskluzīvi dati var būt pieejami par maksu.

Padoms: Lai atrastu nozarei specifisku repozitoriju, var izmantot re3data(Registry of Research Data Repositories) – globālo reģistru, kas aptver vairāk nekā 3000 repozitoriju no visām zinātnes nozarēm un ļauj meklēt pa disciplīnām, filtrēt pa piekļuves tipiem un salīdzināt kvalitātes standartus. Platforma palīdz atrast piemērotāko repozitoriju ar labākajiem standartiem un ilgtermiņa perspektīvām gan datu publicēšanai, gan to iegūšanai.

 

DataverseLV

DataverseLV ir drošs, daudznozaru pētniecības datu repozitorijs Latvijā, ko atbalsta Latvijas zinātnes universitātēs – Latvijas Biozinātņu un tehnoloģiju universitāte, Latvijas Universitāte, Rīgas Stradiņa universitāte un Rīgas Tehniskā universitāte – un Augstākās izglītības un zinātnes IT koplietošanas pakalpojumu centrs. Tas izveidots 2025. gadā, un tā pamatā ir Hārvardas Universitātes atvērtā koda programmatūra Dataverse, kas ļauj atvērti pārvaldīt, kopīgot un saglabāt pētniecības datus.

DataverseLV ir pirmais nacionālais zinātnes datu repozitorijs Latvijā, kas rada iespējas vietējiem pētniekiem publicēt savus datus atbilstoši starptautiskajiem atvērtās zinātnes standartiem. Repozitorijs nodrošina datu ilgtermiņa saglabāšanu, piešķir DOI numurus citējamībai un piedāvā strukturētu metadatu sistēmu. Tas ir īpaši svarīgs Latvijas kontekstā, jo ļauj saglabāt un padarīt pieejamus datus par vietējiem sociāliem, ekonomiskiem un vides procesiem, kas citādi varētu nebūt atrodami starptautiskajos repozitorijos.

Datu kopas repozitorijā var meklēt pēc atslēgvārdiem vai kategorijām. Atvērtās datu kopas ir brīvi pieejamas, pārējām jāpieprasa piekļuve attiecīgās datu kopas autoram vai autoriem. 

https://dv.dataverse.lv/ 

Valsts līmeņa datu avoti veido pētniecības infrastruktūras pamatu, nodrošinot piekļuvi uzticamai un aktuālai informācijai, kas nepieciešama akadēmiskai pētniecībai, politikas veidošanai un sabiedrības informēšanai. Atšķirībā no privātiem avotiem, valsts iestādes piedāvā oficiālos, standartizētos datus, kas bieži ir vienīgie autoritatīvie avoti par konkrētiem valsts mēroga procesiem.

Šie datu avoti aptver plašu spektru – no demogrāfiskajiem un ekonomiskajiem rādītājiem līdz veselības statistikai un vides monitoringam. Valsts datu galvenās priekšrocības ir augstā kvalitāte, metodiskā konsekvence un plašais aptverams, lai gan mikro datu piekļuve var būt ierobežota un prasīt īpašu pieteikumu.

 

Centrālā statistikas pārvalde

Centrālā statistikas pārvalde (turpmāk – CSP) ir tiešās pārvaldes iestāde, kura darbojas Latvijas Republikas Ekonomikas ministrijas pārraudzībā, un ir galvenā valsts oficiālās statistikas sagatavošanas darbu veicēja un koordinatore valstī. CSP ir atbildīga par valsts oficiālās statistikas nodrošināšanas darba organizāciju Latvijā un par datu pareizību, kurus ieguvusi, apkopojot no respondentiem saņemto informāciju.

CSP virsmērķis ir nodrošināt aktuālu statistisko informāciju, stratēģijas darbības periodā attīstot partnerību jaunu datu avotu un metožu izmantošanā statistikas ražošanā. CSP apkopo, apstrādā un publicē statistiku, kas ir būtiska gan valsts pārvaldei, gan uzņēmumiem, pētniekiem un sabiedrībai kopumā.

Datu kopu piemēri: 

  • makro dati: demogrāfija (iedzīvotāju skaits pa novadiem, dzimstība, mirstība), ekonomika  (IKP pa nozarēm, inflācija, darba samaksa), darba tirgus (bezdarba līmenis, nodarbinātība pa nozarēm), sociālie rādītāji (nabadzības risks, dzīves kvalitātes indeksi);
  • mikro dati: mājsaimniecību budžetu apsekojuma individuālie ieraksti, darbaspēka apsekojuma detalizētie dati, uzņēmumu struktūras apsekojuma dati.

CSP vietnē pieejamie makro dati ir par brīvu un, lai tiem piekļūtu, nav nepieciešams reģistrēties. Datus var meklēt pēc atslēgvārdiem un kategorijām.

Savukārt mikro datus drīkst izmantot tikai pētnieciskiem nolūkiem, turklāt pētījuma rezultātam jānodrošina ieguvums visai sabiedrībai. Piekļuvi datiem var iegūt, sūtot pieteikumu uz e-pastu research@csp.gov.lv. Pieteikumam pievieno aizpildītu veidlapu, kurā jānorāda veicamā pētnieciskā projekta apraksts, pamatojums, kāpēc pētnieciskajam darbam ir nepieciešami netieši identificējami dati, kā tiks nodrošināta konfidenciālu datu aizsardzība. 

https://stat.gov.lv/lv 

 

Slimību profilakses un kontroles centrs

Slimību profilakses un kontroles centrs (turpmāk – SPKC) ir Latvijas Republikas veselības ministra pakļautībā esoša tiešās pārvaldes iestāde, kuras darbības mērķi ir īstenot valstī sabiedrības veselības politiku epidemioloģiskās drošības un slimību profilakses apakšjomās un veselības aprūpes politiku veselības aprūpes kvalitātes apakšjomā un nodrošināt veselības veicināšanas politikas īstenošanu un koordināciju.

SPKC veselības statistikas datubāze ietver dažādus veselības un veselības aprūpes rādītājus: iedzīvotāju veselība, mātes un bērna veselība, veselības aprūpe, mirstība, iedzīvotāju veselību ietekmējošie paradumi, veselības aprūpes iznākums un pacientu drošība.

SPKC vietnē pieejamie makro dati ir par brīvu un, lai tiem piekļūtu, nav nepieciešams reģistrēties. Datus var meklēt datu bāzē pēc kategorijām un atslēgvārdiem.

https://statistika.spkc.gov.lv/pxweb/lv/Health/

Lai piekļūtu mikro datiem, nepieciešams aizpildīt pieteikumu un iesniegt to SPKC. Pieteikšanās procesa apraksts pieejams šajā vietnē

 

Latvijas Atvērto datu portāls

Latvijas atvērto datu portāls ir tiešsaistes platforma, kurā tiek publicēti un padarīti pieejami valsts un pašvaldību iestāžu rīcībā esošie dati atvērtā formātā. Portāla izveides mērķis ir veicināt caurspīdīgumu, sabiedrības līdzdalību un inovācijas, nodrošinot ikvienam piekļuvi dažādu jomu datu kopām – piemēram, par vidi, ekonomiku, sabiedrisko transportu, veselību un izglītību.

Portāls darbojas saskaņā ar atvērto datu principiem: dati ir bez maksas pieejami, tos var lejupielādēt, pārstrādāt un izmantot gan pētniecības, gan uzņēmējdarbības, gan sabiedrības vajadzībām. Lielākā daļa datu ir strukturēti un pieejami standartizētos formātos (piemēram, CSV, JSON), kas ļauj viegli tos izmantot digitālās lietotnēs un analītiskos risinājumos.

Latvijas atvērto datu portāls ir daļa no Eiropas Savienības atvērto datu iniciatīvām un ir savienots ar Eiropas datu portālu, veicinot starptautisku datu pieejamību un pārrobežu sadarbību.

Portāls satur datus par dažādām kategorijām: ārlietas, ekonomika, enerģija, iedzīvotāju un sabiedrība, izglītība un sports, kultūra, reģioni un pašvaldības, tieslietas/iekšlietas un drošība, transports, valsts pārvalde, veselība, vide, zemkopība, zinātne un tehnoloģijas. 

Piekļuve datiem ir bez maksas un, lai tiem piekļūtu, nav nepieciešams reģistrēties. Datus var meklēt pēc atslēgvārdiem un kategorijām.

https://data.gov.lv/lv 

Starptautiskie datu avoti ir fundamentāli mūsdienu pētniecībā, jo tie nodrošina piekļuvi plašam un salīdzināmam datu klāstam, kas aptver dažādas jomas un reģionus visā pasaulē. Atšķirībā no nacionālajiem avotiem, starptautiskās organizācijas piedāvā standartizētus datus, kas ļauj veikt uzticamus salīdzinājumus starp valstīm un reģioniem, analizēt globālas tendences un novērtēt relatīvo pozīciju starptautiskā kontekstā.

Starptautiskie datu avoti piedāvā arī garas laikrindas, kas ļauj analizēt attīstības tendences gadu desmitu garumā, kā arī prognozes un analītiskos materiālus, kas papildina statistiskos datus ar ekspertu vērtējumiem un interpretācijām.

 

Eurostat

Eurostat ir Eiropas Savienības oficiālais statistikas birojs, kura galvenais uzdevums ir harmonizēt un publicēt uzticamu, salīdzināmu statistiku par visām ES dalībvalstīm. Dibināts 1953. gadā kā Eiropas Komisijas struktūrvienība, Eurostat šodien ir kļuvis par vienu no autoritatīvākajiem Eiropas datu avotiem, kas nodrošina gan politikas veidotājus, gan pētniekus ar objektīvu statistisko informāciju par procesiem visā Eiropā.

Eurostat unikālā vērtība slēpjas tā spējā standartizēt dažādu valstu statistiku, izmantojot vienotas definīcijas, klasifikācijas un metodoloģijas. Tas nozīmē, ka Latvijas IKP rādītājs ir aprēķināts pēc tādiem pašiem principiem kā Vācijas vai Francijas, ļaujot veikt uzticamus salīdzinājumus. Birojs aptver praktiski visas sabiedrības dzīves jomas un regulāri publicē gan ikgadējos statistikas krājumus, gan operatīvos rādītājus.

Datu kopu piemēri:

  • ekonomika: IKP, inflācija, tirdzniecības bilance, valdības parāds pa ES valstīm;
  • demogrāfija: iedzīvotāju sastāvs, dzimstība, mirstība, migrācija, novecošanas indeksi;
  • darba tirgus: nodarbinātība, bezdarbs;
  • vide: siltumnīcefekta gāzu emisijas, atjaunojamā enerģija.;

Visi Eurostat makrodati ir brīvi pieejami bez reģistrācijas Eurostat tīmekļa vietnē. Vietne piedāvā gan vienkāršu meklēšanu, gan sarežģītus vaicājumus ar daudziem filtriem un laika dimensijām.

https://ec.europa.eu/eurostat 

Latvijas Universitāte ir iekļauta Eurostat atzīto zinātnisko institūciju sarakstā, kas LU zinātniekiem dod iespēju piekļūt arī mikro datiem.  – individuālu mājsaimniecību, uzņēmumu vai personu anonimizētiem ierakstiem. Lai iegūtu piekļuvi mikro datiem, nepieciešams aizpildīt pieteikumu ar pētījuma aprakstu un pamatojumu (pamācība).

Jautājumu vai neskaidrību gadījumos sazinieties ar LU Eurostat kontaktpersonu – Zinātnes departamenta vecāko eksperti Aiju Ertu (e-pasts: aija.erta@lu.lv, tālr.: 67034938).

 

OECD

OECD (Organisation for Economic Co-operation and Development) jeb Ekonomiskās sadarbības un attīstības organizācija ir starptautiska organizācija, kas apvieno 38 ekonomiski attīstītākās valstis ar demokrātisku pārvaldi un tirgus ekonomiku. Dibināta 1961. gadā, OECD mērķis ir veicināt ekonomisko izaugsmi, uzlabot dzīves kvalitāti un risināt globālas problēmas, balstoties uz pierādījumiem balstītu politiku un starptautisku sadarbību.

OECD unikālā vērtība slēpjas tās analītiskajā kapacitātē un spējā apvienot politikas izstrādi ar kvalitatīvu datu vākšanu. Organizācija ne tikai apkopo statistiku, bet arī veic dziļas salīdzinošās analīzes, izstrādā starptautiskos standartus un sniedz politikas ieteikumus. Tas padara OECD datus īpaši vērtīgus pētniekiem, jo tie ir ne tikai statistiski precīzi, bet arī kontekstualizēti ar ekspertu analīzēm un politikas rekomendācijām.

Organizācija ir pazīstama ar saviem regulārajiem pārskatiem par dalībvalstu ekonomiku, izglītības sistēmu novērtējumiem un inovatīviem indeksiem, kas kļuvuši par starptautiskajiem etalonu mērījumiem. OECD dati bieži kalpo kā pamats politikas diskusijām gan nacionālā, gan starptautiskā līmenī.

Datu kopu piemēri:

  • PISA izglītības dati: skolēnu sniegums matemātikā, lasīšanā, zinātnēs pa valstīm un laika periodiem;
  • nodokļu politika: nodokļu likmes, nodokļu ieņēmumi;
  • inovācijas: pētniecības un attīstības ieguldījumi;
  • sociālie rādītāji: ienākumu nevienlīdzība, nabadzības riski, sociālā mobilitāte.
  • attīstības indikatori: IKP uz vienu iedzīvotāju, nabadzības līmenis;
  • izglītība: lasītpratības līmenis, skolas apmeklējums pa līmeņiem;
  • veselība: bērnu un māšu mirstība, dzīvildze, vakcinācijas līmenis;
  • infrastruktūra: elektrības pieejamība, drošs ūdens, sanitārijas pakalpojumi, interneta penetrācija;
  • klimats un vide: CO₂ emisijas, meža segums.

OECD vietne (https://www.oecd.org/en/data.html) piedāvā brīvu piekļuvi visiem makro datiem bez reģistrācijas prasībām. Vietne nodrošina gan vienkāršu meklēšanu, gan sarežģītus analītiskos rīkus ar iespēju izveidot pielāgotus grafikus un tabulas. Papildus statistikai, OECD publicē arī metodiskos aprakstus un analītiskos pārskatus, kas palīdz interpretēt datus. 

Praktisks padoms: OECD dati ir īpaši vērtīgi salīdzinošiem pētījumiem, jo organizācija regulāri analizē Latvijas sniegumu attiecībā pret citām dalībvalstīm un sniedz konkrētus uzlabojumu ieteikumus. 

 

Pasaules Banka

Pasaules Banka ir starptautiska organizācija, kas dibināta 1944. gadā ar mērķi palīdzēt valstīm attīstīties, mazināt nabadzību un veicināt ilgtspējīgu izaugsmi. Sākotnēji veidota Eiropas atjaunošanai pēc Otrā pasaules kara, organizācija šodien darbojas kā globāls finanšu un konsultatīvs partneris, īpaši fokusējoties uz jaunattīstības un vidējo ienākumu valstīm.

Pasaules Bankas unikālā pozīcija globālajā attīstības finansēšanā tai dod iespēju apkopot un publicēt vienu no plašākajiem starptautisko attīstības datu klāstiem pasaulē. Organizācija ne tikai sniedz aizdevumus un tehnisko palīdzību, bet arī sistemātiski vāc datus par ekonomisko, sociālo un vides attīstību visās pasaules valstīs. Šie dati ir īpaši vērtīgi, jo aptver gan attīstītās, gan jaunattīstības valstis, ļaujot analizēt globālos attīstības modeļus un salīdzināt dažādu reģionu pieredzi.

Pasaules Bankas datu vākšana balstās uz sadarbību ar nacionālajiem statistikas birojiem, starptautiskajām organizācijām un pētniecības institūtiem. Organizācija ne tikai apkopo esošos datus, bet arī izstrādā jaunus indikatorus un metodikas, lai labāk izmērītu attīstības procesus. Īpaši nozīmīgi ir Pasaules Bankas nabadzības mērījumi un dzīves kvalitātes indikatori, kas kļuvuši par starptautiskajiem standartiem.

Datu kopu piemēri:

Pasaules Banka piedāvā brīvu piekļuvi visiem datiem bez reģistrācijas prasībām. Vietne nodrošina gan vienkāršus meklēšanas rīkus, gan sarežģītus analītiskos instrumentus ar iespēju izveidot pielāgotus grafikus, kartes un salīdzinājumus. Dati tiek regulāri atjaunināti un aptver garas laikrindas – dažos gadījumos līdz pat 19. gadsimta vidum, kas ļauj analizēt ilgtermiņa attīstības tendences. 

https://data.worldbank.org/

Praktisks padoms: Pasaules Bankas dati ir īpaši noderīgi pētījumiem par globālajām tendencēm, attīstības valstu pieredzi un Latvijas pozīciju starptautiskajā kontekstā, jo organizācija piedāvā visaptverošu skatījumu uz attīstības procesiem.

 

Eiropas datu portāls

Eiropas datu portāls ir Eiropas Savienības galvenā atvērto datu platforma, kas apvieno un padara pieejamus publiskā sektora datus. Portāla mērķis ir ne tikai nodrošināt piekļuvi datiem, bet arī veicināt to atkārtotu izmantošanu, lai radītu ekonomisko un sociālo vērtību. 

Portālā ir pieejami dati no visām ES dalībvalstīm, kā arī no citām Eiropas valstīm, un tas aptver plašu tēmu loku – sākot no transporta un vides līdz veselībai, izglītībai un ekonomikai. Informācija ir pieejama dažādās valodās, kas padara to lietojamu ne tikai ekspertiem, bet arī plašākai sabiedrībai. 

Papildus pašiem datiem portāls piedāvā arī mācību materiālus un vadlīnijas par to, kā šos datus izmantot efektīvi. No 2021. gada portāls zināms ar nosaukumu data.europa.eu, un tas ir galvenais ES avots, kur meklēt atvērtos datus. 

Dati Eiropas datu portālā ir pieejami bez reģistrācijas un par brīvu. Tos var meklēt pēc atslēgvārdiem un kategorijām.  

Praktisks padoms: Eiropas datu portāls ir īpaši vērtīgs pētniecībai par ES politiku ietekmi, reģionālajām atšķirībām Eiropā un starptautiskajiem salīdzinājumiem, jo tas aptver gan Latvijas, gan citu ES valstu datus vienuviet.

https://data.europa.eu/en

Datu meklēšana un iegūšana var šķist sarežģīts uzdevums, īpaši ņemot vērā milzīgo pieejamo avotu daudzveidību un dažādos piekļuves nosacījumus. Praktiskie ieteikumi ir izveidoti, lai palīdzētu pētniekiem un studentiem sistēmiski un efektīvi orientēties datu meklēšanas procesā. Neatkarīgi no tā, kādam pētnieciskajam darbam meklēsiet datus, šie padomi palīdzēs atrast kvalitatīvus un uzticamus datu avotus.

 

Kā meklēt datus

Veiksmīga datu meklēšana sākas ar skaidru pētniecības jautājuma definīciju. Pirms meklēšanas precīzi formulējiet, ko vēlaties uzzināt, kāda veida dati nepieciešami (kvantitatīvi, kvalitatīvi, laikrindu), kāds ir pētījuma mērogs (lokāls, nacionāls, starptautisks) un kāds laika periods interesē.

Izstrādājiet meklēšanas terminu sarakstu latviešu valodā nacionālajiem avotiem un angļu valodā starptautiskajiem repozitorijiem. Iekļaujiet sinonīmus un nozares specifiskos terminus – piemēram, meklējot bezdarba datus, izmantojiet gan "unemployment", gan "jobless rate".

Sāciet ar Google Dataset Search kā universālu sākumpunktu. Izmantojiet īsus, vispārīgus terminus angļu valodā, pat meklējot Latvijas datus. Apskatiet meklēšanas rezultātus un identificējiet perspektīvākos datu avotus turpmākai pārbaudei. Tālāk meklējiet konkrētajos avotos: akadēmiskos datus – Zenodo, Figshare, DataverseLV; Latvijas statistiku – CSP, SPKC, Latvijas atvērto datu portāls; starptautiskos datus – Eurostat, OECD, Pasaules Banka.

Neaizmirstiet par zinātniskajām publikācijām – tajās ir atsauces uz vērtīgām datu kopām, īpaši metodikas sadaļās un papildmateriālos. Izvēlieties avotus atkarībā no datu veida: aktuālāko statistiku meklējiet CSP, SPKC un Eurostat, bet vēsturiskām laikrindām izmantojiet Pasaules Bankas un OECD datus.

Ņemiet vērā, ka katrai zinātnes nozarei ir savi galvenie datu avoti. Sociālajās zinātnēs sāciet ar CSP un Eurostat sociālo rādītāju datiem. Ekonomikā izmantojiet CSP, Eurostat un OECD, papildiniet ar Pasaules Bankas datiem. Veselības jomā meklējiet SPKC un Eurostat veselības statistikā. Vides pētījumiem izmantojiet Latvijas atvērto datu portālu un Eurostat vides datus. Izglītības pētījumiem fokusējieties uz CSP, Eurostat un OECD PISA datiem. Pētniecības datus un publikācijas meklējiet, piemēram, Zenodo un Figshare.

 

Kā izvairīties no kļūdām datu meklēšanā

Izvairieties no tipiskajām kļūdām: nemeklējiet tikai latviešu valodā starptautiskajos avotos, nesalīdziniet tikai vienu avotu un nelejupielādējiet datus, nelasot dokumentāciju. Vienmēr izmantojiet angļu valodu ar "Latvia" vai "Latvian", salīdziniet vairākus avotus un iepazīstieties ar datu vākšanas procesu.

Ja neatrodat nepieciešamos datus, paplašiniet meklēšanas terminus ar sinonīmiem vai radniecīgām jomām. Meklējiet līdzīgos pētījumus un analizējiet, kādus datus viņi izmantoja. Apsveriet datu kombinēšanu no vairākiem avotiem vai kontaktējieties ar nozares ekspertiem.

 

Kā novērtēt datu kvalitāti

  • Izvērtējiet datu avota uzticamību – valsts statistikas biroji (CSP, Eurostat) piedāvā augstāko kvalitāti, starptautiskās organizācijas (OECD, Pasaules Banka) nodrošina standartizētus datus, akadēmiskie repozitoriji satur recenzētus materiālus.
  • Pārbaudiet, kā dati vākti, cik liels ir paraugu izmērs, vai tie ir reprezentatīvi un cik bieži atjaunināti.
  • Novērtējiet datu pilnību – vai ir daudz trūkstošo vērtību, vai aptver vajadzīgo laika periodu, vai definīcijas ir konsekventas.
  • Izlasiet dokumentāciju – vienmēr iepazīstieties ar datu aprakstu un metodiku, lai saprastu datu ierobežojumus un izmantošanas nosacījumus.
 

Kā iegūt un dokumentēt datus

Brīvi pieejamos datus lejupielādējiet nekavējoties – dažkārt organizācijas maina piekļuves nosacījumus, formātus vai pat izņem datus no vietnes. Ierobežotas piekļuves datiem jāiesniedz pieteikums ar pētījuma aprakstu – rēķinieties, ka šādu pieteikumu apstrāde var aizņemt vairākas nedēļas.

Vienmēr dokumentējiet katru datu kopu – avota nosaukumu, saiti, lejupielādes datumu, versiju un licences nosacījumus.