Måned: desember 2014

Har du talt fugler?

Dompap Opphavsrett: Eli Brager

Dompap
Opphavsrett: Eli Brager

Det nærmer seg jul. Kanskje du har hengt ut fuglenek og meiseboller?  I løpet av juledagene er det mange som nyter synet av våre små fuglevenner nær hus og hytter. Kanskje du har talt fugler? Fra hager i hele landet telles det hvor mange fugler som er på besøk og hvilken art fuglene tilhører.

Men hva har dette med forskningsdata å gjøre? Den generelle utviklingen av teknologi og økt bruk av internett i befolkningen har gjort det mulig for forskerne å operere utenfor den tradisjonelle forskningskonteksten. Dette betyr at det er mulig å samle inn data på andre måter enn tidligere. Forskerne får mulighet til å skaffe seg et annet datagrunnlag enn tidligere. Større tilgang på informasjon fører til nye måter å kommunisere ut informasjonen, organiseres og kombinere og informasjon og data.

Hagefugltellingen har foregått årlig fra 2008 i regi av Norsk ornitologisk forening. I Hagefugltellingen 2014 ble det talt 300 000 fugler i 5200 hager rundt om i landet.

Skulle du ha lyst til å teste ut selv i julen? Hvorfor ikke telle Fugler ved foringsplassen?

Ha en riktig fin julefeiring!

– Therese

 

Reklamer

NB-prosjektet på BI

Når vi startet bloggen nevnte jeg at vi har fått tildelt midler fra Nasjonalbiblioteket. Midlene skal brukes for å finne hvordan det lokale, institusjonelle forskningsdataarkivet BIRD forholder seg til andre aktører for avlevering og lagring av forskningsdata. Frem til nå har forberedelser vært i fokus. Nå er det snart klart for å ta steget videre. Jeg har laget en foreløpig beskrivelse:

Forskningsdata i Norge – hva tilbyr de største aktørene?

Norske forskere har pekt på en rekke forhold som hinder deling av forskningsdata. Mangel på teknisk infrastruktur og tid til å forbedre data for arkivering nevnes. Skepsis til åpne forskningsdata i frykt for at det skal hindre vitenskapelig publisering i fremtiden er en annen faktor. Er forskernes tvil begrunnet?

Internasjonalt er det identifisert funksjonalitet og støttetjenester som kan benyttes i arkiver for forskningsdata. Funksjonaliteten vil ivareta mange av forskernes bekymringer omkring lagring og deling av forskningsdata.

Dette gjør det interessant å se på hvilke tilbud og funksjonalitet som finnes for avlevering, lagring og deling av forskningsdata. Denne presentasjonen vil se på hva de største, nasjonale aktørene for datalagring tilbyr til forskerne i Norge.

Resultatene kan bidra til en begynnende avklaring om oppgaver og arbeidsfordeling mellom utdanningsinstitusjonen, fag- og forskningsbibliotekene og dataarkiv.

– Skal du på BIBSYS-konferansen 2015? Da kan du høre resultatene. Stikk gjerne innom sesjonen om forskningsdata 11. mars kl. 12.30.

– Therese

Drukner i data

Forskerforum 10/14I går kom siste nummer i Forskerforum i postkassen min.

Datadrevet vitenskap med store datasett og tungregnemaskiner er fokus i artikkelen. Bruk av store datasett er i ferd med å innta mange fagområder. Det nevnes biologi, medisin og helsevitenskap, fysikk, klima, språk- og samfunnsvitenskapene.

Dette er en ny måte å drive vitenskap på. Utfordringer er knyttet til personvern og sensitive data dersom man skal dele data. Behov for kompetanse på feltet er stor, både innen statistikk, dataprogrammering, standarder og kunnskap om hvordan man skal dokumentere data.

Kjersti Gjengedal: I petabytens tid. Forskerforum, 10, 2014,s.12-17: http://www.forskerforum.no/uploads/forskerforum/pdf/Forskerforum_nett_10__2014_pdf.pdf

I løpet av det siste året har det vært skrevet en del om forskere og deres bruk av data i forskningen.

–  Hva synes du er en interessant artikkel om bruk av data i forskningen? Har du et tips til oss?

Skriv gjerne i kommentarfeltet eller send meg et hint.

– Therese

Forskningsdata på Muninkonferansen

Denne uken har jeg truffet mange kollegaer fra nær og fjern på Muninkonferansen i Tromsø. Det var mye interessant på konferansen: open access, ulike typer målinger som impact factor og altmetric. Torsdag handlet flere av presentasjonene om forskningsdata. Her kommer en liten kortversjon:

Geoffrey Boulton, University of Edinburgh, gav en meget bra presentasjon om «Open Data and the Future of Science«. Bakgrunnen for hvorfor man trenger åpne data og hva det betyr for forskningen var tema. Han trakk frem muligheter for å etterprøve forskningen. Innsamling av data på en annen måte enn i dag, gjerne ved at allmennheten deltar i innsamling av data, ble vektlagt. Muligheten for å løse vitenskapelige problemer i fellesskap ble også trukket frem. Han mener at innen de neste 10 årene vil open data være en driver til å endre måten som vi tenker om forskning og skape andre modeller for hvordan forskning foregår.

Vi fikk høre om 2 store prosjekter om forskningsdata i Tyskland og Østerrike. Det er virkelig imponerende hvor mye arbeid som investeres, og fellesnevneren er samarbeid mellom mange aktører.

Pappenberger fortalte om de 9 universitetene i regionen Baden – Wüerttemberg i Tyskland, hvor målet er å finne ut hvilke infrastruktur og tjenester som er nødvendig for å gjøre regionen ledende innen forskning og utvikling.

I prosjektet, bwFDM, vil de bruke 3.7, mill. euro. til å lage handlingsplaner. Det er 9 fulltidsansatte ved alle universitetene og 1 prosjektkoordinator. Alle bibliotekene er involvert, men det varierer mellom de forskjellige institusjonene hvordan de bidrar.

I regionen er det ca. 30 000 forskere som er igjen knyttet til ca. 3000 forskningsgrupper. De har intervjuet ca. 700 forskere omkring hvordan de jobber og hva deres behovet er. Mest kvalitativ metode er brukt, hvor  1635 brukerhistorier som er skapt ut fra intervjuene.

Vi må vente helt til juni 2015 før resultatene er klare. Rapporten skal resultere i tiltak, og foreløpig virker det som om forskerens behov og arbeidsmåter vil tyde på behov for bredde i tiltakene. Litt overraskende ser foreløpige resultater ut som om de fleste forskerne er opptatt av støttetjenester. I starten av prosjektet antok de at forskerne ville ha en sterkere fokus på den tekniske infrastrukturen.

På Pappenbergers eget universitetet, Universitet i Konstanz, har de tatt utgangpunkt i 1 av de 1635 brukerhistoriene. Dette har resultert i et arkiv, Movebank, som viser sporing av dyr. Arkivet inneholder nå ca. 50 datasett. Målet med Movebank er å knytte sammen publikasjoner og data. Arkivet vil brukes som et utgangspunkt for å kunne analysere forskernes behov bedre. I tillegg vil bibliotek og IT lage en strategi for forskningsdata og en datahåndteringspolitikk for universitetet.

Arkivet TROLLing ble presentert av Laura Janda. Arkivet er åpent for opplasting av lingvistiske studier for forskere over hele verden. Nylig har de laget videoer som forklarer hvorfor det er lurt å lagre data og praktisk instruksjon til forskere som vil laste opp data i arkivet

Budroni fortalte om hvordan det i  Østerrike arbeideres med å få på plass en e-infrastruktur for forskningsdata, «e-infrastructure Austria«. Prosjektet skal gå totalt over 3 år, og snart har prosjektet fungert sammen i 1 år. Det er 25 partnerinstitusjoner i prosjektet. I tillegg har de etablert en tankesmie med eksterne for å hjelpe med utfordring og muligheter.

Prosjektet består av 3 deler. Prosjektdel A handler om å få på plass en enkel infrastruktur for lagring av forskningsdata. Prosjektdel B er mer komplisert, hvor det legges vekt på hvordan man kan kombinere data. Prosjektdel C er knyttet til behovet for samarbeid mellom institusjoner. De har identifisert 12 arbeidsområder hvor de skal prøve å finne felles løsninger/standarder. Spredningen av tema er stort fra langtidslagring til metadata til markedsføring. En av de viktigste elementene er at de blir kjent med eksperter på de forskjellige universitetene og kan støtte seg på hverandre i etterkant. Å være informert og følge standarder og retningslinjer fra organisasjoner slik som APARSEN, OpenAire, DMP og COAR er også viktig.

Sven Vladmick snakket om «data policy and data archives». Han er knyttet til Europena Data Watch Extended, EDaWAX. De hr som mål å utvikle et dataarkiv for økonomiske tidsskrifter.  Han omtalte 2 studier:

Andreoli-Versbach, P., & Mueller-Langer, F. (2014). Open access to data: An ideal professed but not practised. Research Policy, 43(9), 1621-1633. doi: http://dx.doi.org/10.1016/j.respol.2014.04.008

Studien har sett på praksis blant 488 forskere innen økonomi og business science.  Undersøkelsen viser at 80 % ikke deler data, 16,8 % deler av og til, kun 2,46 % deler regelmessig. Årsaken til at forskerne deler data er knyttet til mulighetene for ansettelse og opparbeidelse av anerkjennelse i fagmiljøet.

Den andre studien var knyttet til «Data policy of economic journals«. Fokus ble satt på 141 økonomiske tidsskrifter som er anerkjent i fagmiljøet. De skiller mellom policy inneholder et krav om å gjøre data tilgjengelig, og policy som inneholder informasjon om kode og utregningsmetode. Dersom ikke kode og utregningsmåte er med, så mener man at det er vanskelig å etterprøve resultatene. Dette omtales som en replication policy.

Undersøkelsen fant at de fleste økonomiske tidsskriftene ikke har en policy for tilgjengeliggjøring av data. Blant studiene som har en policy er det kun et fåtall av disse som har krav om en replication policy. Ved en nærmere undersøkelse av innholdet i policy, fant studien at de fleste tidsskriftene krever at forfatteren skal arkivere data. Imidlertid varierer det om man blir bedt om å gi mer detaljerte beskrivelser av data og kode. I forskning hvor data, kode og utregning er tilgjengelig er det er varierende hvor tilrettelagt data er i praksis, slik at etterprøvbarhet kan gjennomføres.

Undersøkelsen viser at det er flere viktige intensiver for forskerne å dele data. Policy i tidsskrifter er en medvirkende årsak. Videre er forskernes mulighet for anerkjennelse når de deler data, og muligheter for å få støtte når man vil dele av data.

– Therese