Forskningsinstitusjoner

Forskningsdata på BI – Hvilke behov har forskerne?

Forskernes behov i sitt arbeid med forskningsdata er tema for min masteroppgave.  I løpet av de siste 3 årene som jeg har arbeidet i bibliotek, så er det blitt stor fokus på hva som skal være bibliotekets oppgaver fremover. Internasjonalt har forskningsdata blitt omfavnet av biblioteksektoren for sin relevans for lagring av digitale ressurser og behovet for støttetjenester som råd og veiledning til forskerne. I Norge har temaet vært beskjedent omtalt.

For forskerne har det internasjonalt og nasjonalt blitt stilt flere krav til lagring og deling av forskningsdata i forbindelse med publisering av vitenskapelige arbeider og søknader om forskningsmidler, for eksempel fra Forskningsrådet og EU. Dette innebærer en utfordring for forskningsinstitusjonene ved at de skal bistå med tilrettelegging for en god forskningsinfrastruktur og vurdere opprettelse av retningslinjer for egen forskningsinstitusjon i arbeidet med forskningsdata.

Forståelse for forskernes behov ved egen forskningsinstitusjon er et viktig utgangspunkt for arbeid med lagring og bevaring av forskningsdata.

Formålet med studien er å kartlegge forskningsdata som finnes ved Handelshøyskolen BI. Målet er å finne ut hvilke dataformater og -typer som finnes, hvordan data lagres, deles og gjenbrukes. Dette vil være med på å identifisere risikomomenter slik som misbruk, tap eller manglende gjenfinning av data. Det vil gi en økt forståelse av forskeres arbeidsflyt og holdninger til data og deling. Studien vil være med på å identifisere forslag til hvordan man kan forbedre eksisterende praksis i organisasjonen, og aktuelle samarbeidspartnere utenfor organisasjonen.

Er du nysgjerrig på resultatene, så vil de første funnene presenteres på Universitets- og høyskolebibliotekkonferansen i juni. Deretter vil resultatene bli publisert som masteroppgave ved Høyskolen i Oslo og Akershus, Institutt for arkiv, bibliotek og informasjonsfag.

– Therese

Advertisements

Hvordan sitere datasett?

How to Cite Datasets and Link to Publications

How to Cite Datasets and Link to Publications

Sitering av forskningsdata er en viktig faktor ved arkivering og deling av data. De mest kjente siteringsstilene har utviklet standarder for sitering til forskningsdata. Å sitere forskningsdata er ganske likt sitering av andre publikasjonstyper.

For at sitering av forskningsdata fra et arkiv skal være mulig, bør arkivet tilby en løsning med permanente lenker. Dette er en DOI, eller tilsvarende slik som Handle, Archival Resource Key (ARK) and Persistent URL (PURL).

I tillegg kan datasett har knyttet til seg en Unique Numeric Fingerprint (UNF). Dette er en henvisning til versjonen av data, for å sikre at data ikke er endret. Da kan denne referansen hentet fra et Dataverse arkiv se slik ut:

Frederico Girosi; Gary King, 2006, ‘Cause of Death Data’, http://hdl.handle.net/1902.1/UOVMCPSWOL
UNF:3:9JU+SmVyHgwRhAKclQ85Cg== IQSS Dataverse Network [Distributor] V3 [Version].

Utfordringen for siteringer er at man gjerne har en artikkel, et datasett, en kodebok, osv. som er med på å beskrive data. Dette betyr at flere referanser kan bli relativt like. Noen siteringsstiler ber om at man oppgir materialtype, altså spesifiserer at referansen er et datasett. Dette ser man for eksempel hos APA.

Interesserte kan studere detaljer nærmere i: Ball, A. & Duke, M. (2012). ‘How to Cite Datasets and Link to Publications’. DCC How-to Guides. Edinburgh: Digital Curation Centre: http://www.dcc.ac.uk/resources/how-guides

– Therese

Datatidsskrifter

Har du hørt om den nye typen tidsskrifter? I løpet av de siste 2-3 årene er det opprettet mange datatidsskrifter (Data Journals). Dette er en kategori av tidsskrifter som publiserer artikler om datasett.  Datatidsskrifter skiller seg fra de fleste andre tidsskrifter, hvor fokus er på resultatene fra forskningen eller en beskrivelse av selve forskningsmetoden.

Tidsskriftene gir andre forskere hjelp til å finne informasjon om datasett, og er et virkemiddel for å øke gjenbruk av forskningsdata. For forfatterne er dette en måte å få anerkjennelse for data som de selv har samlet inn.

En dataartikkel vil fokusere på å beskrive et datasett. Det kan inneholde informasjon omkring hvordan data er innsamlet, hvordan det er behandlet, hvilken programvare som er brukt filformater o.l. Leseren skal ha mulighet til å forstå når, hvordan og hvorfor data ble samlet inn.

Når en forsker vil publisere i et datatidsskrift, møter hun de samme kravene som ved øvrige tidsskriftpublikasjoner. Tidsskriftet kan være fagfellevurdert, open access eller abonnementsbasert.

Det kan være krav om at datasettene skal være arkivert i bestemte arkiver eller i tilknytning til arkiv fra tidsskriftforlaget.

Beskrivelser av data eller metadata må gjerne følge bestemte standarder. Det kan være krav om at data skal ha permanente lenker, som DOI eller lignende. Det er vanlig at det lenkes direkte til datasettet som omtales. I mange tilfeller fremheves det hvordan datasettet skal siteres. Koblinger til andre artikler som omtaler resultater er viktig for å gi tilleggsinformasjon om hva resultatene av forskningen viste.

Forfatteren må ta stilling til opphavsrett når de ønsker å publisere en artikkel. I tillegg kan det ved publisering i datatidsskrift være krav om at data skal ha bestemte lisenser eller bestemte muligheter for leseren for å få tilgang til data.

Datatidsskrifter finnes etterhvert innen mange fagområder. Her er noen eksempler:

Flere eksempler på datatidsskrift kan finnes hos Katrine Akers: A Growing List of Data Journal. Data@MLibrary: http://mlibrarydata.wordpress.com/2014/05/09/data-journals/

– Therese

 

Veilednings- og rådgivningstjenester

Informasjon omkring hvordan forskeren kan gå frem, og hvordan hun kan gjøre sine data tilgjengelig blir viktigere. Bibliotekene kan ta en rolle med å bistå med informasjonstjenester om tilgjengeliggjøring av data, og forståelse av datasett som er lagret.

Hjelp til tilgjengeliggjøring av data
Mange forskere vet ikke hvilke tjenester som er tilgjengelig for datalagring eller kan ha problemer mellom å velge mellom forskjellige tjenester. Biblioteket blir sett på som en aktør som kan bistå med informasjon om god dataadministrasjon, fordelene med datadeling, mulighetene som er tilgjengelig innen bestemte fagområder og hva som er de beste og mest pålitelige tjenestene. Bibliotek kan inkludere datamateriale i deres egne kataloger for lettere gjennomfinning av tilgjengelige datasett. På denne måten kan terskelen for datalagring senkes.

Bistå med tilgjengeliggjøring av informasjon omkring hvor datasett kan finnes
Informasjon omkring hvor datasett kan finnes kan integreres i bibliotekets tjenester, slik at bibliotekets discovery-tjenester høster informasjon. Eventuelt kan det utarbeides en protokollhøsting til en felles norsk plattform, etter prinsippet bak NORA som i dag administreres av CRIStin.

Bistå med tilgjengeliggjøring av informasjon som fremmer forståelse av datasett
For å kunne fortolke data er det nødvendig med gode beskrivelser av data, beskrivelser kan forekomme som datapublikasjoner eller som lenking til publikasjoner som bruker data.

Bibliotekene kan:

  • Lage oversikter over hvor datasett kan finnes (discovery services for datasets)
  • Integrere datasett i øvrige gjenfinningstjenester (bibliotekkataloger)
  • Etablere og opprettholde kunnskapsbaser om data og deres kontekst
  • Støtte krysskoblinger/crosslinks mellom publikasjoner og datasett
  • Gi støttetjenester omkring informasjon omkring standardiseringer slik som opphavsrett, lisensieringer, kvalitet på lagringstjenester basert på sertifiseringer og søknadsprosedyrer for gjenbruk av datasett.
  • Gi hjelp til forskerne for å forstå metabeskrivelser for datasett

Veilednings- og informasjonstjenester kan være en rolle for bibliotekene i arbeidet med forskningsdata.

– Therese

Lage institusjonelle lagringsløsninger for datasett (repositories)

Norske forskere har i dag muligheter til å lagre data i forskjellige typer arkiver. Dette kan være arkiver som er forbeholdt ansatte ved en bestemt forskningsinstitusjon, dvs. institusjonelle arkiver. Institusjonelle arkiver er vanligvis plassert organisatorisk i tilknytning til et bibliotek eller IT-avdelingen. Andre arkivformer kan være nasjonale eller internasjonale datalagringsarkiver eller arkiver innen faglige forskningsområder eller knyttet til bestemte forskningsmetoder.

I Norge finnes det institusjonelle arkivløsninger ved de fleste universitetene og høyskolene. De drives av bibliotekene. Arkivene inneholder publiserte tidsskriftartikler, masteroppgaver, rapportserier og annet materiale. På en del fagfelt, hvor det det ikke finnes så mange etablerte praksiser, kan et institusjonelt arkiv for forskningsdata avhjelpe situasjonen.

Bibliotekenes erfaringer med denne typen arkivløsninger er verdifullt med hensyn til opprettelser av arkiver for forskningsdata. Kjennskap til Discovery tjenester (samsøk), informasjons- og metadatastandarder regnes som viktig funksjonalitet i arkiver for forskningsdata. Når forskningsdata skal lagres vil formatene på data som anvendes vil i mange tilfeller være andre enn i dagens arkiver, slik som for eksempel bilder eller lyd. Gjenfinning vil ha andre standarder og behov enn dagens institusjonelle arkiv for publikasjoner. Det finnes egne tekniske systemer produsert for å være institusjonelle løsninger for forskningsdata, men en del av dagens systemer kan utvikles for å ta høyde for andre filformater og informasjon slik at de kan benyttes til forskningsdata.

Utvikling av institusjonelle arkiver for lagring av datasett kan inngå som roller for bibliotekene.

– Therese

 

Metadatastøtte – for bedre gjenfinning av datasett

Bibliotekarer har arbeidet mye med metadata i forbindelse med katalogisering. I arbeidet med forskningsdata er det en forutsetning for gjenfinning er at gode metadatabeskrivelser legges på datasettene. I tillegg er det behov for permanente lenker som knytter sammen metadata om datasett (katalogposter) og publikasjoner om datasett (fagartikler eller datatidsskriftartikler). Det pekes på at Data Management Plans bør kunne kobles sammen med annen informasjon omkring selve lagringen av data og publikasjoner.

Bibliotekene kan bistå andre deler av organisasjonen/datalagringssenter med anbefalinger omkring metadata og tilhørende internasjonale standarder som benyttes for gjenfinning av datasett.

Bibliotekene kan:

  • Støtte arbeidet med permanente lenker og siteringsstandarder
  • Oppmuntre til utviklingen av felles metadatabeskrivelsesskjema og felles siteringspraksiser
  • Fremme bruk av felles standarder og verktøy blant forskere

Metadatastøtte til gjenfinning av data er en av aktivitene som kan inngå som roller for bibliotekene.

-Therese

Roller for bibliotekene?

Er forskningsdata et arbeid for bibliotek? Hva kan det innebære? Det er ikke mange norsk bibliotek som arbeider aktivt med forskningsdata. Dette er ikke så rart. Arbeid med tilrettelegging og deling av forskningsdata er ikke kommet langt i Norge. Internasjonalt har flere organisasjoner sett på ulike aktiviteter og roller som bibliotekene kan ta. Rapportene og føringene kan oppsummeres i 4 aktiviteter. Disse aktivitetene kan i seg selv utgjøre en rolle for bibliotekene, eller flere aktivitetene kan forekomme i en kombinasjon. På denne måten kan de utgjøre mulige roller innen forskningsdata for bibliotek i høyere utdanning:

Bloggen vil fremover komme med en utdyping av hva disse 4 aktivitetene innebærer i egne poster. Postene er basert på følgende rapporter og føringer:

– Therese

Datahåndteringsplan i skyen

En av konsekvensene av at Forskningsrådet innfører en politikk for tilgjengelighet av forskningsdata er at forskeren skal lage en datahåndteringsplan. I USA og Storbritannia er det laget nettbaserte verktøy for å lage datahåndteringsplaner. Kan verktøyet DMP Online kan brukes i en nasjonal skyløsning? Dette har Danmarks Elektroniske Fag- og forskningsbibliotek [DEFF] testet.

Digital Curation Center står bak DMP Online (UK). DMP Online består av nettbasert skjema som forskerne fyller ut. Forskjellige forskningsfinansiører og universiteter har ulike retningslinjer. Dette resulterer i ulike ønsker om informasjon fra forskeren om forskningsdataene. Informasjonen er knyttet til hvordan forskningsdata lagres, bevares og deles, som for eks. DMP i Horizon 2020. En datahånteringsplan vil minst inneholde en beskrivelse av forskningsprosjektets data. Hvordan data oppbevares under og etter prosjektet og hvem som skal ha tilgang til data er også vanlige spørsmål.

Forskjellene ivaretas i DMP Online ved at det lages maler som er tilrettelagt for ulike typer forskningsfinansiører og/eller eget universitet.  Malene, som er tilgjengelig i systemet i dag, er hovedsakelig tilpasset britiske og amerikanske forskningsfinansører og universiteter.

DMP Online gjør det mulig for forskeren å samarbeide med kollegaer, arbeide videre med datalagringsplanen etterhvert som forskningsprosjektet utvikler seg. Det er mulig å eksportere datahåndteringsplanen slik at den kan legges inn i søknader om forskningsmidler.

Danmarks Elektroniske Fag- og forskningsbibliotek konkluderer med at DMP Online kan relativt lett tilpasses til danske behov, og brukes som en nasjonal skyløsning.

Bakgrunnen for konklusjonen er beskrevet i rapporten FIF – Fælles Infrastruktur for Forskningsdata. Rapporten beskriver en del av de tekniske aspektene ved DMP Online og gir anbefalinger før en nasjonal skytjeneste kan realiseres.

DEFF anbefaler at utdanningsinstitusjonene og forskningsfinansiørene har utviklet sin egen politikk for forskningsdata. Grunnen er at policy er en forutsetning for funksjonaliteten i DMP Online, slik at maler kan lages. For at systemet skal fungere trengs det:  liste over utdannelsesinstitusjoner og fond, maler for datamanagement hos de enkelte fond og forskningsinstitusjoner, tekster og logoer.

I Danmark er det versjon 4 av webapplikasjonen DMP Online som er testet. DMP Online anvender åpen kildekode. Den er programmert ved bruk av Ruby on Rails, og MySQL anvendes som database. Den åpne kildekoden er tilgjengelig i GitHub. Planen kan eksporteres til forskjellige formater, eks HTML, XML, Text eller Json.

Rapporten fremhever at ved hjelp av en programmerer for Ruby on Rails vil DMP Online kunne tilpasses danske forhold relativt enkelt i løpet av noen måneder. Det er viktig å ivareta muligheter for at et eventuelt dansk system kan integreres med senere versjoner av DMP Online. Programvaren kan driftes i hvilken som helst skyløsning.

Rapporten peker på at dette er et relativt nytt system. Det finnes tilgjengelig en brukerveiledning. Likevel er det tekniske systemet dårlig dokumentert i dag, men DCC er oppmerksom på utfordringen og skal arbeide med det. Dette gjør at installasjon og konfigurering tar litt lenger tid.

DEFF ønsker en bedre integrasjon med andre tekniske systemer i fremtidig utvikling. De peker blant annet på funksjonalitet som lenking til dataarkiver og publiseringsplattform. Utveksling av informasjon gjennom uttrekk og gjenbruk av forskningsdatadokumentasjon på tvers av systemer kan videreutvikles. Dette vil være bra slik at man kan følge en datahåndteringsplan gjennom et forskningsprosjektet.

DMP Online krever pålogging før bruk. DEFF mener at i fremtiden vil det være ønskelig å ha muligheter til å koble DMP Online til single-sign-on løsning. De tenker på danske WAYF. Dette er en lignende løsning som norske Feide som gir en felles elektronisk identitet for pålogging til datasystemer i universitets- og høyskolesektoren.

Avslutningsvis mener DEFF at det er et behov for å opprette en organisasjon som kan vedlikeholde, drifte og markedsføre DMP Online.

– Therese

Hva nå? Konsekvenser av policy

Nå har flere forskningfinansiører og myndigheter lagt frem sine retningslinjene for åpen tilgjengeliggjøring av forskningsdata

Hva er de praktiske konsekvensene for den enkelte forsker og universitets- og høyskolesektoren?

Se videoen for en kortfattet oppsummering

 

Kartlegging av forskningsdata ved UiO

I går fanget jeg opp den rykende ferske artikkelen om UiOs arbeidsgruppe for forskningsdata.  I tiden frem til mars 2015 skal gruppen kartlegge eksisterende praksis for lagring og deling av forskningsdata ved UiO.  Kartleggingen vil legge grunnlaget for anbefalinger omkring løsninger for lagring og deling av forskningsdata.

Forskningsrådet oppfordrer til at institusjonene lager egne retningslinjer for forskningsdata. Arbeidsgruppen vil komme med innspill til retningslinjer for UiO, og se på hvordan ansattes rettigheter på best mulig måte kan ivaretas.

Les hele artikkelen i Uniforum:

Tidemann, G. (13.10.14) Forskningsdata skal deles. Uniforum: http://www.uniforum.uio.no/nyheter/2014/10/forskningsdata-skal-deles.html

 

– Therese