kompetanse

Siste nytt – Bibsyskonferansen

Det er gått en stund siden siste innlegg på bloggen. Det har vært en travel tid, men her kommer en liten oppdatering. I midten av mars var jeg på Bibsys-konferansen. Digitalt akademia var det overordnede temaet. Jeg var positivt overrasket over hvor mange av presentasjonene som nevnte forskningsdata som en mulig oppgave for bibliotekene fremover. På konferansen holdt jeg et av innleggene på parallellseksjonen om Forskningsdata nasjonalt og lokalt. Dette har jeg fortalt om tidligere i posten NB-prosjektet på BI. Prosjektet har som mål å skrive en rapport som beskriver hvilket tilbud og funksjonalitet som finnes for avlevering, lagring og deling av forskningsdata.

Presentasjonen med lydopptak kan finnes her:

Skagen, Therese (11.03.2015) Forskningsdata i Norge – Hva tilbyr de største aktørene? Presentasjon fra BIBSYS-konferansen, 10-11.03.15: http://www.bibsyskonferansen.no/opptak-fra-konferansen/

Først er presentasjonen til Ellen Hermanrud og Frode Bakken, som fortalte om sin dSpace installasjon for forskningsdata ved Høyskolen i Telemark. Min presentasjon finner dere halvveis etter ca. 25 min. Det var kjekt å se mange i salen, og få flere aktuelle spørsmål i etterkant.

NB-prosjektet på BI er i en avslutningsfase nå. Rapporten tar for seg i større detalj hvilke krav til funksjonalitet til forskningsdataarkiv møter, og gir et øyeblikksbilde av to av Norges forskningsdataarkiver. Rapporten kommer på bloggen om en liten stund.

Jeg skriver for øyeblikket på min masteroppgave om forskningsdata. Den har ikke vært omtalt på bloggen enda. Mer kommer…

– Therese

 

Reklamer

IDCC 2015 – 10th International Digital Curation Conference

IDCC 2015-konferansen gikk av stabelen 9-10. februar i London, med to påfølgende dager med workshops. Tema for konferansen var en oppsummering av de siste ti år på feltet og utfordringene framover. Interessant, utfordrende og mye å ta inn.

Keynote-speaker Tony Hey pekte på innføringer av standarder som en av de viktige tingene i løpet av de siste ti årene. Det gjelder både lagring og bevaring, men ikke minst interoperabilitet for åpne data. De nye utfordringene gjelder i stor grad det fjerde paradigmet: Data-intensiv forskning, hvor enorme mengder data som skal lagres og ikke minst bevaring. Organisering av tjenester blir like viktig som tilgjengligegjøring av data – workflow, tilgang, brukervennlighet. Hva skal lagres, og hvor lenge? Ikke minst er opphav «provenance» viktig. Hvor kommer dataene fra? Hvordan er de bearbeidet, manipulert, hvilke programmer er brukt etc.?

Kvalitetssikring av dataene er viktig for gjenbruk. Deling av data øker bruken, fremmer forskning og nytten overskrider kostnadene, iflg. JISC. Nettopp kostnader var et tema for mange. Forskningsinfrastrukturen må på plass, og hvordan skal den finansieres? Er det institusjonene, forskningsfinansiørene, det offentlige? Serverplass prises høyt, og noen steder tok institusjonen så mye for lagring at forskerne heller benyttet kommersielle tjenester.

Forskernes rolle er viktig. De må være ledende i utvikling av disse tjenestene, og forstå hva det vil si å være forsker i en digital virkelighet. Datahåndtering og bevaring må inn som en del av deres arbeidsflyt helt fra starten. Deres vilje til å dele data må utvikles der den ikke finnes, enten med pisk eller med gulrot – eller i realiteten en kombinasjon av disse. Data management plans og data policies er styringsredskaper som må på plass på nasjonalt og institusjonelt nivå. Finansiørene har sine sanksjonsmuligheter: Bevilgninger fornyes ikke, dersom forskerne ikke lagrer dataene som avtalt. Men dette blir ikke alltid fulgt opp der det er etablert som ordning.

Hva så med bibliotekenes rolle? Noen tok til orde for å flytte biblioteket tilbake til instituttene, for å integrere bibliotekarene i arbeidet med forskningsdata i større grad. Bibliotekenes kompetanse på metadata, opphavsrett og publisering ble sett på som ferdigheter som kunne transformeres over til også å gjelde forskningsdata. Og kontaktbibliotekarer ble sett som en ressurs inn mot forskerne for å etablere kontakt, informere og lære opp forskerne. Et samarbeid mellom forskere, IT og bibliotek synes naturlig for mange.

Oppsummert kan man si at det er driv og optimisme rundt dette, men hindringer i form av økonomi, infrastruktur, holdninger og tradisjoner. Videre må det forskes mer på gjenbrukbarheten til dataene og den faktiske bruken. Vi vil kanskje se nye måter å bygge og presentere kunnskap på (crowdsourcing, for eksempel) – hvordan vil den vitenskapelige kommunikasjonen endres, når vi fokuserer mer på data?

Det var flere workshoper i etterkant av konferansen. Jeg deltok på workshopen ”Training the trainers” – om undervisningsopplegg rundt forskningsdata for bibliotekarer og andre. Mange gode eksempler, men også klart at det er et krevende felt som krever mer enn et to-timers-kurs.

Konferansen samlet over 300 deltagere fra Europa og USA, men den skandinaviske kontingenten telte kun 8. Et tegn på at man er helt i startgropa med dette i vår del av verden, noe som også ble bekreftet i samtale med de andre skandinaviske deltagerne. Finland jobber med policyer og strategier – de ønsker open science inn i alle institusjonelle strategier og målet er open science som standard.

– Ellen Hermanrud

NorStore Research Data Archive

NorStoreForrige uke var jeg på det første NorStore Research Data Training Seminar som ble holdt på campus ved Universitetet i Oslo.

NorStore Research Data Archive er et tilbud til forskere i hele landet ved alle fagfelt. NorStore retter seg inn mot offentlig finansiert forskning. Arkivet er for datasett knyttet til publisert forskning.

Forskeren må gi opplysninger om datasettet og hvem som skal ha råderett over data. Det garanteres tilgjengelighet av data inntil 10 år.

Informasjon om datasettene som er lagret i arkivet er offentlig tilgjengelig. Du kan søke opp datasett på nettsiden til arkivet: https://www.norstore.no/services/archive

Dersom du ønsker tilgang til forskningsdata, så må du henvende deg til forskeren/forskergruppen for å få tillatelse.

For en forsker som ønsker å laste opp data til arkivet kreves brukernavn og passord. De fleste forskere kan bruke sitt vanlige brukernavn og passord, siden dette er knyttet til brukertilgangen som universiteter og høyskoler har gjennom FEIDE.

Datasett kan lastes opp via en nettløsning. Dersom datasettet er større enn 5 GB, så kan kommandobasert opplasting brukes. Filene blir låst i den versjonen som de lastes opp i.

Research Data Archive er en av flere tjenester fra NorStore. Arkivet ble lansert i mars 2014. Arkivet skal evalueres i løpet av 2015. Andre tjenester fra NorStore er:

Project Area er en plattform hvor man kan lagre store datasett, og gi tilgang til en forskningsgruppe. Offentlig finansierte prosjekter kan søke om å få bruke prosjektområdet.

Tjenester for sensitive data (TSD) er muligheter for å lagre data som inneholder personsensitive opplysninger, både helseopplysninger og andre sensitive data. Tjenesten er utviklet ved USIT i samarbeid med Norstore. Dette er nå et nasjonalt tilbud.

– Therese

NB-prosjektet på BI

Når vi startet bloggen nevnte jeg at vi har fått tildelt midler fra Nasjonalbiblioteket. Midlene skal brukes for å finne hvordan det lokale, institusjonelle forskningsdataarkivet BIRD forholder seg til andre aktører for avlevering og lagring av forskningsdata. Frem til nå har forberedelser vært i fokus. Nå er det snart klart for å ta steget videre. Jeg har laget en foreløpig beskrivelse:

Forskningsdata i Norge – hva tilbyr de største aktørene?

Norske forskere har pekt på en rekke forhold som hinder deling av forskningsdata. Mangel på teknisk infrastruktur og tid til å forbedre data for arkivering nevnes. Skepsis til åpne forskningsdata i frykt for at det skal hindre vitenskapelig publisering i fremtiden er en annen faktor. Er forskernes tvil begrunnet?

Internasjonalt er det identifisert funksjonalitet og støttetjenester som kan benyttes i arkiver for forskningsdata. Funksjonaliteten vil ivareta mange av forskernes bekymringer omkring lagring og deling av forskningsdata.

Dette gjør det interessant å se på hvilke tilbud og funksjonalitet som finnes for avlevering, lagring og deling av forskningsdata. Denne presentasjonen vil se på hva de største, nasjonale aktørene for datalagring tilbyr til forskerne i Norge.

Resultatene kan bidra til en begynnende avklaring om oppgaver og arbeidsfordeling mellom utdanningsinstitusjonen, fag- og forskningsbibliotekene og dataarkiv.

– Skal du på BIBSYS-konferansen 2015? Da kan du høre resultatene. Stikk gjerne innom sesjonen om forskningsdata 11. mars kl. 12.30.

– Therese

Forskningsdata på Muninkonferansen

Denne uken har jeg truffet mange kollegaer fra nær og fjern på Muninkonferansen i Tromsø. Det var mye interessant på konferansen: open access, ulike typer målinger som impact factor og altmetric. Torsdag handlet flere av presentasjonene om forskningsdata. Her kommer en liten kortversjon:

Geoffrey Boulton, University of Edinburgh, gav en meget bra presentasjon om «Open Data and the Future of Science«. Bakgrunnen for hvorfor man trenger åpne data og hva det betyr for forskningen var tema. Han trakk frem muligheter for å etterprøve forskningen. Innsamling av data på en annen måte enn i dag, gjerne ved at allmennheten deltar i innsamling av data, ble vektlagt. Muligheten for å løse vitenskapelige problemer i fellesskap ble også trukket frem. Han mener at innen de neste 10 årene vil open data være en driver til å endre måten som vi tenker om forskning og skape andre modeller for hvordan forskning foregår.

Vi fikk høre om 2 store prosjekter om forskningsdata i Tyskland og Østerrike. Det er virkelig imponerende hvor mye arbeid som investeres, og fellesnevneren er samarbeid mellom mange aktører.

Pappenberger fortalte om de 9 universitetene i regionen Baden – Wüerttemberg i Tyskland, hvor målet er å finne ut hvilke infrastruktur og tjenester som er nødvendig for å gjøre regionen ledende innen forskning og utvikling.

I prosjektet, bwFDM, vil de bruke 3.7, mill. euro. til å lage handlingsplaner. Det er 9 fulltidsansatte ved alle universitetene og 1 prosjektkoordinator. Alle bibliotekene er involvert, men det varierer mellom de forskjellige institusjonene hvordan de bidrar.

I regionen er det ca. 30 000 forskere som er igjen knyttet til ca. 3000 forskningsgrupper. De har intervjuet ca. 700 forskere omkring hvordan de jobber og hva deres behovet er. Mest kvalitativ metode er brukt, hvor  1635 brukerhistorier som er skapt ut fra intervjuene.

Vi må vente helt til juni 2015 før resultatene er klare. Rapporten skal resultere i tiltak, og foreløpig virker det som om forskerens behov og arbeidsmåter vil tyde på behov for bredde i tiltakene. Litt overraskende ser foreløpige resultater ut som om de fleste forskerne er opptatt av støttetjenester. I starten av prosjektet antok de at forskerne ville ha en sterkere fokus på den tekniske infrastrukturen.

På Pappenbergers eget universitetet, Universitet i Konstanz, har de tatt utgangpunkt i 1 av de 1635 brukerhistoriene. Dette har resultert i et arkiv, Movebank, som viser sporing av dyr. Arkivet inneholder nå ca. 50 datasett. Målet med Movebank er å knytte sammen publikasjoner og data. Arkivet vil brukes som et utgangspunkt for å kunne analysere forskernes behov bedre. I tillegg vil bibliotek og IT lage en strategi for forskningsdata og en datahåndteringspolitikk for universitetet.

Arkivet TROLLing ble presentert av Laura Janda. Arkivet er åpent for opplasting av lingvistiske studier for forskere over hele verden. Nylig har de laget videoer som forklarer hvorfor det er lurt å lagre data og praktisk instruksjon til forskere som vil laste opp data i arkivet

Budroni fortalte om hvordan det i  Østerrike arbeideres med å få på plass en e-infrastruktur for forskningsdata, «e-infrastructure Austria«. Prosjektet skal gå totalt over 3 år, og snart har prosjektet fungert sammen i 1 år. Det er 25 partnerinstitusjoner i prosjektet. I tillegg har de etablert en tankesmie med eksterne for å hjelpe med utfordring og muligheter.

Prosjektet består av 3 deler. Prosjektdel A handler om å få på plass en enkel infrastruktur for lagring av forskningsdata. Prosjektdel B er mer komplisert, hvor det legges vekt på hvordan man kan kombinere data. Prosjektdel C er knyttet til behovet for samarbeid mellom institusjoner. De har identifisert 12 arbeidsområder hvor de skal prøve å finne felles løsninger/standarder. Spredningen av tema er stort fra langtidslagring til metadata til markedsføring. En av de viktigste elementene er at de blir kjent med eksperter på de forskjellige universitetene og kan støtte seg på hverandre i etterkant. Å være informert og følge standarder og retningslinjer fra organisasjoner slik som APARSEN, OpenAire, DMP og COAR er også viktig.

Sven Vladmick snakket om «data policy and data archives». Han er knyttet til Europena Data Watch Extended, EDaWAX. De hr som mål å utvikle et dataarkiv for økonomiske tidsskrifter.  Han omtalte 2 studier:

Andreoli-Versbach, P., & Mueller-Langer, F. (2014). Open access to data: An ideal professed but not practised. Research Policy, 43(9), 1621-1633. doi: http://dx.doi.org/10.1016/j.respol.2014.04.008

Studien har sett på praksis blant 488 forskere innen økonomi og business science.  Undersøkelsen viser at 80 % ikke deler data, 16,8 % deler av og til, kun 2,46 % deler regelmessig. Årsaken til at forskerne deler data er knyttet til mulighetene for ansettelse og opparbeidelse av anerkjennelse i fagmiljøet.

Den andre studien var knyttet til «Data policy of economic journals«. Fokus ble satt på 141 økonomiske tidsskrifter som er anerkjent i fagmiljøet. De skiller mellom policy inneholder et krav om å gjøre data tilgjengelig, og policy som inneholder informasjon om kode og utregningsmetode. Dersom ikke kode og utregningsmåte er med, så mener man at det er vanskelig å etterprøve resultatene. Dette omtales som en replication policy.

Undersøkelsen fant at de fleste økonomiske tidsskriftene ikke har en policy for tilgjengeliggjøring av data. Blant studiene som har en policy er det kun et fåtall av disse som har krav om en replication policy. Ved en nærmere undersøkelse av innholdet i policy, fant studien at de fleste tidsskriftene krever at forfatteren skal arkivere data. Imidlertid varierer det om man blir bedt om å gi mer detaljerte beskrivelser av data og kode. I forskning hvor data, kode og utregning er tilgjengelig er det er varierende hvor tilrettelagt data er i praksis, slik at etterprøvbarhet kan gjennomføres.

Undersøkelsen viser at det er flere viktige intensiver for forskerne å dele data. Policy i tidsskrifter er en medvirkende årsak. Videre er forskernes mulighet for anerkjennelse når de deler data, og muligheter for å få støtte når man vil dele av data.

– Therese

MUNIN – konferansen

Det er i Tromsø det skjer i høst. Den årlige internasjonale Munin-konferansen ved UiT går av stabelen 26 og 27.november.  I år tar den 9.ende konferansen for seg temaene forskningsdata, «metrics» og forleggernes rolle.

Folkene bak UiT Dataverse Network er tilstede, så det gir muligheter for en førstehånds prat om deres erfaringer. Programmet inneholder også flere kjente navn innen områdene forskningsdata og Open Access.

Dagen før arrageres den nasjonale Open Access dagen. Absolutt av interesse for dem som er opptatt av åpen tilgang til publikasjoner og data.

Jeg ser frem til mange spennende diskusjoner og innlegg. Treffer jeg deg der?

En ekstra bonus er muligheter for å se vakkert nordlys, dersom været er riktig.

Ta en titt på årets progam, og meld deg på:

http://site.uit.no/muninconf/?page_id=2

– Therese