Ukategorisert

Lagring av forskningsdata i Norge

Lagring av forskningsdata i NorgeNB-prosjektet på BI er omtalt tidligere på bloggen. Jeg har hatt i oppgave å se på hvilke tilbud og funksjonalitet som finnes for avlevering, lagring og deling av forskningsdata. Rapporten vektlegger hva de største, nasjonale aktørene for datalagring tilbyr til forskerne i Norge. De foreløpige resultatene ble presentert på BIBSYS-konferansen i mars. Nå er den ferdige rapporten publisert:

Skagen, Therese. (2015). Lagring av forskningsdata i Norge – Hva tilbyr de største arkivene?
Prosjektrapport.
Lastet ned fra http://hdl.handle.net/11250/283600

Rapporten legger vekt på de tekniske kravene til forskningsdataarkiver. Kravene er identifisert gjennom rapporter og anbefalinger til forskningsdataarkiver. Forordet og etterordet belyser mulige implikasjoner for bibliotekenes virksomhet. Under vises sammendraget til rapporten:

I løpet av de to siste årene er det kommet krav fra forskningsfinansiører omkring tilgjengeliggjøring av forskningsdata når prosjekter har fått økonomisk støtte (European Commission, 2013; Norges forskningsråd, 2014b). Kravene innebærer at forskeren må vurdere å gjøre informasjon om digitale forskningsdata tilgjengelig og lagre data over lengre tid. Kravene omtaler digitale resultatdata, som lagres og bevares over tid slik at det kan gjenbrukes. Kravene innebærer at forskningsdataarkiver som infrastruktur må fungere på en bestemt måte. Lagring og bevaring er en avgrenset del av forskningsdatas livssyklus (Jones, Pryor, & Whyte, 2013).

Kravene gjør det interessant å se på hvilke tilbud og funksjonalitet som finnes for avlevering, lagring og deling av forskningsdata. Internasjonalt er det identifisert funksjonalitet og støttetjenester som kan benyttes i arkiver for forskningsdata (Dillo & De Leeuw, 2014; PARADE, 2009; Reilly, Schaller, Schrimpf, Smit, & Wilkinson, 2011). Samlet utgjør funksjonaliteten og støttetjenester kriterier på en kvalitetsmessig standard som dataarkiver vurderes etter før man sier at de tilbyr gode tjenester for lagring og bevaring av forskningsdata.

Gjennom en kartlegging av aktiviteter blant norske aktører for lagring av forskningsdata vil det fokuseres på følgende forskningsspørsmål: Hvilket tilbud gir Norges største aktører for avlevering og lagring av forskningsdata som forskere knyttet til høyere utdanning og forskningsinstitutter kan benytte seg av? Hvilke planer har aktørene for videre arbeid? Denne casestudien ser på de største, nasjonale aktørene for datalagrings tilbud til forskerne i Norge, arkivet til Norsk samfunnsvitenskapelige datatjeneste og NorStore Research Data Archive.

Funksjonalitetene i arkivene er lignende, slik at dette er noe overlappende mellom de to arkivene. Forskjeller i formater og størrelse på data som arkivene kan motta og bevare over tid gjør arkivene forskjellige, slik at de utfyller hverandre. Dersom man tar høyde for utviklingen av forskningsdatainfrastrukturen i Norge som er planlagt, vil de nasjonale tjenestene fra dataarkivene gi de største brukergruppene av forskerne et tilbud for bevaring av data ved bruk av de mest vanlige filformatene.

– Therese

 

 

 

 

Økt deling av forskningsdata?

I dag holdes konferansen Penger og Poeng hvor det akademiske miljøet debatterer åpen tilgjengelighet til vitenskapelig publisering. Open Access til publikasjoner er i fokus, men temaet åpen tilgjengeliggjøring av forskningsdata er på fremvekst.

Tilgjengeliggjøring av forskningsdata ble lansert som policy av Forskningsrådet i september 2014. Før etableringen av en policy, ble det gjort en undersøkelse blant forskere i Norge omkring deres holdninger til åpen tilgjengeliggjøring av forskningsdata. Undersøkelsen viste at forskere flest er positiv til å dele forskningsdata, men i praksis er det ikke mange som gjør dette. Grunnene til å ikke dele data er mange. Det ble pekt på mangel på infrastruktur for lagring og deling av data, og tidsbruk for å tilrettelegge data for deling. Frykt for at andre forskere ikke forstår data eller reduksjon i muligheten for fremtidige publikasjoner er andre usikkerhetsmomenter.

– Hva skal til for at forskere skal være motivert for å dele forskningsdata? Knowledge Exchange-rapporten «Sowing the seeds: Incentives and motivations for sharing research data, a researchers perspective» peker på en rekke tiltak for å øke deling av data. Å øke deling av data er en felles innsats blant mange aktører innen forskningen, slik som forskningsfinansiører, forskergrupper, forskningsinstitusjoner, forlag og dataarkiver.

Sowing the Seed

Her er noen foreslåtte tiltak for å øke åpen tilgjengelighet av forskningsdata:

  • Undervisning i forskningsmetode bør inkludere opplæring i hvordan forskningsdata kan deles. Dette er et viktig tiltak for at deling av data skal bli en del av forskningspraksisen.
  • Forskningsmiljøene må selv etablere en forventning i miljøet om åpenhet, og hva som de anser som «best practice» på eget fagfelt.
  • Forskningsinstitusjoner og finansiører kan kreve en plan for hvordan data fra prosjekter skal behandles, datahåndteringsplaner.
  • Det bør gis finansiering av kostnadene ved tilrettelegging og publisering av data.
  • Forskningsdata kan bli en del av vurderingskriterene ved ansettelser eller forfremmelser.
  • Det må være tilgjengelige rådgivningstjenester for hvordan tilrettelegging for lagring og deling av data kan gjøres
  • Det bør være gode, stabile koblinger mellom publikasjoner og tilhørende data.
  • Arkiver for forskningsdata bør finnes i registre for forskningsdata, og det bør være mulig å søke opp datasett integrert i litteraturdatabaser/bibliotekkataloger.

– Therese

Har du talt fugler?

Dompap Opphavsrett: Eli Brager

Dompap
Opphavsrett: Eli Brager

Det nærmer seg jul. Kanskje du har hengt ut fuglenek og meiseboller?  I løpet av juledagene er det mange som nyter synet av våre små fuglevenner nær hus og hytter. Kanskje du har talt fugler? Fra hager i hele landet telles det hvor mange fugler som er på besøk og hvilken art fuglene tilhører.

Men hva har dette med forskningsdata å gjøre? Den generelle utviklingen av teknologi og økt bruk av internett i befolkningen har gjort det mulig for forskerne å operere utenfor den tradisjonelle forskningskonteksten. Dette betyr at det er mulig å samle inn data på andre måter enn tidligere. Forskerne får mulighet til å skaffe seg et annet datagrunnlag enn tidligere. Større tilgang på informasjon fører til nye måter å kommunisere ut informasjonen, organiseres og kombinere og informasjon og data.

Hagefugltellingen har foregått årlig fra 2008 i regi av Norsk ornitologisk forening. I Hagefugltellingen 2014 ble det talt 300 000 fugler i 5200 hager rundt om i landet.

Skulle du ha lyst til å teste ut selv i julen? Hvorfor ikke telle Fugler ved foringsplassen?

Ha en riktig fin julefeiring!

– Therese

 

Drukner i data

Forskerforum 10/14I går kom siste nummer i Forskerforum i postkassen min.

Datadrevet vitenskap med store datasett og tungregnemaskiner er fokus i artikkelen. Bruk av store datasett er i ferd med å innta mange fagområder. Det nevnes biologi, medisin og helsevitenskap, fysikk, klima, språk- og samfunnsvitenskapene.

Dette er en ny måte å drive vitenskap på. Utfordringer er knyttet til personvern og sensitive data dersom man skal dele data. Behov for kompetanse på feltet er stor, både innen statistikk, dataprogrammering, standarder og kunnskap om hvordan man skal dokumentere data.

Kjersti Gjengedal: I petabytens tid. Forskerforum, 10, 2014,s.12-17: http://www.forskerforum.no/uploads/forskerforum/pdf/Forskerforum_nett_10__2014_pdf.pdf

I løpet av det siste året har det vært skrevet en del om forskere og deres bruk av data i forskningen.

–  Hva synes du er en interessant artikkel om bruk av data i forskningen? Har du et tips til oss?

Skriv gjerne i kommentarfeltet eller send meg et hint.

– Therese

Sikre muligheter for gjenbruk av datasett over tid

Gjenbruk av data er et vanskelig aspekt ved datalagring. Over tid vil programvare anvendt for å produsere datasett endres. Dette kan gjøre gjenbruk av data vanskelig, dersom man ikke har tilgang på riktig programvareversjon. Er data tilgjengelig i dagens versjon av statistikkprogrammet SPSS 22, så betyr ikke det at om 10 år vil det være mulig å åpne filen og bruke data. Det vil kreve at data er tilpasset nye versjoner av SPSS og det nye operativsystemet som brukes på din datamaskin, eller gamle systemer er tilgjengelig for avlesing av filer.

Det er en forutsetning for gjenbruk av forskningsdata at man har kjennskap til fagfeltets forståelse av datasett, og tilgang til programvaren som er brukt i forbindelse med datasettet, og kunnskap om bruk av programvaren.

Bibliotekene kan bistå med å tilrettelegge for gjenbruk av forskningsdata ved å:

  • Arkivere og bevare datasett
  • Arkivere programvare nødvendig for gjenbruk/etterprøvbarhet/bedre utnyttelse av data
  • Formidle til forskerne informasjon om fagspesifikke lagringsordninger/arkiver (formater for lagring, dokumentasjonsopplysninger om fremgangsmåte for datainnsamling, lisenser)
  • Å vise under hvilke betingelser datasett kan gjenbrukes (forutsetninger for at andre forskere skal kunne anvende datasett og oppbevare tilhørende programvare)

Sikre muligheter for gjenbruk av datasett over tid kan inngå som roller for bibliotekene.

– Therese

Kartlegging av forskningsdata ved UiO

I går fanget jeg opp den rykende ferske artikkelen om UiOs arbeidsgruppe for forskningsdata.  I tiden frem til mars 2015 skal gruppen kartlegge eksisterende praksis for lagring og deling av forskningsdata ved UiO.  Kartleggingen vil legge grunnlaget for anbefalinger omkring løsninger for lagring og deling av forskningsdata.

Forskningsrådet oppfordrer til at institusjonene lager egne retningslinjer for forskningsdata. Arbeidsgruppen vil komme med innspill til retningslinjer for UiO, og se på hvordan ansattes rettigheter på best mulig måte kan ivaretas.

Les hele artikkelen i Uniforum:

Tidemann, G. (13.10.14) Forskningsdata skal deles. Uniforum: http://www.uniforum.uio.no/nyheter/2014/10/forskningsdata-skal-deles.html

 

– Therese