Forskningsdata på Muninkonferansen

Denne uken har jeg truffet mange kollegaer fra nær og fjern på Muninkonferansen i Tromsø. Det var mye interessant på konferansen: open access, ulike typer målinger som impact factor og altmetric. Torsdag handlet flere av presentasjonene om forskningsdata. Her kommer en liten kortversjon:

Geoffrey Boulton, University of Edinburgh, gav en meget bra presentasjon om «Open Data and the Future of Science«. Bakgrunnen for hvorfor man trenger åpne data og hva det betyr for forskningen var tema. Han trakk frem muligheter for å etterprøve forskningen. Innsamling av data på en annen måte enn i dag, gjerne ved at allmennheten deltar i innsamling av data, ble vektlagt. Muligheten for å løse vitenskapelige problemer i fellesskap ble også trukket frem. Han mener at innen de neste 10 årene vil open data være en driver til å endre måten som vi tenker om forskning og skape andre modeller for hvordan forskning foregår.

Vi fikk høre om 2 store prosjekter om forskningsdata i Tyskland og Østerrike. Det er virkelig imponerende hvor mye arbeid som investeres, og fellesnevneren er samarbeid mellom mange aktører.

Pappenberger fortalte om de 9 universitetene i regionen Baden – Wüerttemberg i Tyskland, hvor målet er å finne ut hvilke infrastruktur og tjenester som er nødvendig for å gjøre regionen ledende innen forskning og utvikling.

I prosjektet, bwFDM, vil de bruke 3.7, mill. euro. til å lage handlingsplaner. Det er 9 fulltidsansatte ved alle universitetene og 1 prosjektkoordinator. Alle bibliotekene er involvert, men det varierer mellom de forskjellige institusjonene hvordan de bidrar.

I regionen er det ca. 30 000 forskere som er igjen knyttet til ca. 3000 forskningsgrupper. De har intervjuet ca. 700 forskere omkring hvordan de jobber og hva deres behovet er. Mest kvalitativ metode er brukt, hvor  1635 brukerhistorier som er skapt ut fra intervjuene.

Vi må vente helt til juni 2015 før resultatene er klare. Rapporten skal resultere i tiltak, og foreløpig virker det som om forskerens behov og arbeidsmåter vil tyde på behov for bredde i tiltakene. Litt overraskende ser foreløpige resultater ut som om de fleste forskerne er opptatt av støttetjenester. I starten av prosjektet antok de at forskerne ville ha en sterkere fokus på den tekniske infrastrukturen.

På Pappenbergers eget universitetet, Universitet i Konstanz, har de tatt utgangpunkt i 1 av de 1635 brukerhistoriene. Dette har resultert i et arkiv, Movebank, som viser sporing av dyr. Arkivet inneholder nå ca. 50 datasett. Målet med Movebank er å knytte sammen publikasjoner og data. Arkivet vil brukes som et utgangspunkt for å kunne analysere forskernes behov bedre. I tillegg vil bibliotek og IT lage en strategi for forskningsdata og en datahåndteringspolitikk for universitetet.

Arkivet TROLLing ble presentert av Laura Janda. Arkivet er åpent for opplasting av lingvistiske studier for forskere over hele verden. Nylig har de laget videoer som forklarer hvorfor det er lurt å lagre data og praktisk instruksjon til forskere som vil laste opp data i arkivet

Budroni fortalte om hvordan det i  Østerrike arbeideres med å få på plass en e-infrastruktur for forskningsdata, «e-infrastructure Austria«. Prosjektet skal gå totalt over 3 år, og snart har prosjektet fungert sammen i 1 år. Det er 25 partnerinstitusjoner i prosjektet. I tillegg har de etablert en tankesmie med eksterne for å hjelpe med utfordring og muligheter.

Prosjektet består av 3 deler. Prosjektdel A handler om å få på plass en enkel infrastruktur for lagring av forskningsdata. Prosjektdel B er mer komplisert, hvor det legges vekt på hvordan man kan kombinere data. Prosjektdel C er knyttet til behovet for samarbeid mellom institusjoner. De har identifisert 12 arbeidsområder hvor de skal prøve å finne felles løsninger/standarder. Spredningen av tema er stort fra langtidslagring til metadata til markedsføring. En av de viktigste elementene er at de blir kjent med eksperter på de forskjellige universitetene og kan støtte seg på hverandre i etterkant. Å være informert og følge standarder og retningslinjer fra organisasjoner slik som APARSEN, OpenAire, DMP og COAR er også viktig.

Sven Vladmick snakket om «data policy and data archives». Han er knyttet til Europena Data Watch Extended, EDaWAX. De hr som mål å utvikle et dataarkiv for økonomiske tidsskrifter.  Han omtalte 2 studier:

Andreoli-Versbach, P., & Mueller-Langer, F. (2014). Open access to data: An ideal professed but not practised. Research Policy, 43(9), 1621-1633. doi: http://dx.doi.org/10.1016/j.respol.2014.04.008

Studien har sett på praksis blant 488 forskere innen økonomi og business science.  Undersøkelsen viser at 80 % ikke deler data, 16,8 % deler av og til, kun 2,46 % deler regelmessig. Årsaken til at forskerne deler data er knyttet til mulighetene for ansettelse og opparbeidelse av anerkjennelse i fagmiljøet.

Den andre studien var knyttet til «Data policy of economic journals«. Fokus ble satt på 141 økonomiske tidsskrifter som er anerkjent i fagmiljøet. De skiller mellom policy inneholder et krav om å gjøre data tilgjengelig, og policy som inneholder informasjon om kode og utregningsmetode. Dersom ikke kode og utregningsmåte er med, så mener man at det er vanskelig å etterprøve resultatene. Dette omtales som en replication policy.

Undersøkelsen fant at de fleste økonomiske tidsskriftene ikke har en policy for tilgjengeliggjøring av data. Blant studiene som har en policy er det kun et fåtall av disse som har krav om en replication policy. Ved en nærmere undersøkelse av innholdet i policy, fant studien at de fleste tidsskriftene krever at forfatteren skal arkivere data. Imidlertid varierer det om man blir bedt om å gi mer detaljerte beskrivelser av data og kode. I forskning hvor data, kode og utregning er tilgjengelig er det er varierende hvor tilrettelagt data er i praksis, slik at etterprøvbarhet kan gjennomføres.

Undersøkelsen viser at det er flere viktige intensiver for forskerne å dele data. Policy i tidsskrifter er en medvirkende årsak. Videre er forskernes mulighet for anerkjennelse når de deler data, og muligheter for å få støtte når man vil dele av data.

– Therese

Advertisements

Legg igjen en kommentar

Fyll inn i feltene under, eller klikk på et ikon for å logge inn:

WordPress.com-logo

Du kommenterer med bruk av din WordPress.com konto. Logg ut / Endre )

Twitter picture

Du kommenterer med bruk av din Twitter konto. Logg ut / Endre )

Facebookbilde

Du kommenterer med bruk av din Facebook konto. Logg ut / Endre )

Google+ photo

Du kommenterer med bruk av din Google+ konto. Logg ut / Endre )

Kobler til %s