Data Management

Håndtering af forskningsdata

Data Management handler om optimal håndtering af forskningsdata gennem hele deres livscyklus. Fra indledende planlægning til indsamling og processering af data, til afsluttende publicering, arkivering eller destruktion af data.

Den typiske livscyklus for forskningsdata er:

  • Planlægning: I planlægningsfasen fokuseres der på at afdække eventuelle krav til datahåndteringen, og at dokumentere håndteringen af disse. Det dækker samtidig processen omkring screening af eksempelvis samarbejdspartneres datapolitikker, f.eks. krav om open access, afklaring af rettigheder til data, relevant lovgivning m.v.
     
  • Indsamling, analyse og processering: Fokus på faciliteter til at arbejde med data, sikkerhed, og dokumentation af data ved hjælp af metadata m.v.
     
  • Arkivering: Langtidsopbevaring af data er vigtig, både for dig som forsker, men også for arkiver, universiteter og andre der måtte have interesse i dine data.
     
  • Publicering: Data kan gøres tilgængelige på mange forskellige platforme (repositories), med meget forskellige forhold omkring adgang, rettigheder mv. Muligheden for tildeling af DOI'er eller andre former for persistente identifikationer til datasæt til brug i artikler m.v., er også afgørende for, at dataene kan genfindes.

Forskningsprocessen er i høj grad en iterativ proces, hvorfor ovenstående punkter også kan kører i ring flere gange. Du skal ikke fortvivle, hvis din datahåndtering ikke lige passer ind i denne procesmodel.

Fokusområder for data management

Foruden den ovenstående livscyklus, er der typisk fokus på følgende emner, der går på tværs af  forskningsdataenes livscyklus:

  • Backup og gendannelse: Hvilke muligheder er der for backup af data, og hvordan skal en eventuel gendannelse af data finde sted, hvis der et datatab?
     
  • Etik og privatliv: Særlig i arbejdet med personfølsomme data, er der stort fokus på, hvordan individets data sikres i processen, og hvilke etiske og lovgivningsmæssige krav der er gældende. I forbindelse med publicering er der et særligt fokus på, hvordan individet sikres igennem anonymisering af data.
     
  • Reference og citation: Behovet for at kunne refererer til egne og andres data, er særligt vigtigt i.f.m. publicering af data og artikler. Det kræver dels, at egne data er på en platform, hvor dette kan lade sig gøre, og at dataene er i en form, hvor det er muligt.
     
  • Sikkerhed: Sikring af data handler om at have korrekt opsatte mekanismer, der sørger for, at kun de rette personer har adgang til dataene, og at eventuelle krav til logning af adgang overholdes.
     
  • Ansvar og roller: Hvem har ansvaret for at sikre god datapraksis, herunder indgå aftaler med levendører af services etc.? Herunder indgår også overvejelser om, hvem der eksempelvis varetager administrationen af adgang til data efter et projekt er ophørt.
     
  • Økonomi: Planlægning, ekstra omkostninger til konvertering af data, plads til arkivering mv. er alt sammen økonomiposter, der kan belaste et forskningsprojekts budget. For at kunne anskueliggøre udgifterne til datahåndtering, er det derfor vigtigt at have overblik over dataenes livscyklus.
     
  • IPR og licenser: Hvem har rettighederne til dataene, hvilken licens gælder for dataene, og hvem har beføjelser til at give andre adgang til dataene?
     
  • Filformater: I forbindelse med arkivering og publicering, stilles der krav om - eller anbefales - at der lagres i åbne non-proprietære formater. Eksempelvis lagring af tabulære data i CSV, billeder i JPG mv.
     
  • Integritet- og kvalitetssikring: Hvilken datadokumentation findes der, som kan anskueliggøre processen omkring datahåndtering, og hvorledes er dette tilgængeligt? Hvilke konventioner for navngivning, folderstrukturer mv. anvendes?
     
  • Metadata: Hvilke metadata (data om data) ledsager forskningsdataene, således at det er forståelige og kan fremfindes.

Forskellige krav til din håndtering af forskningsdata

Der kan være forskellige krav til din håndtering af data. Typisk kommer de fra fra enten bevillingsgivere, forlag, lovgivning eller samarbejdspartnere. Den letteste måde at blive bevidst om disse krav er ved at udarbejde en data management plan. Dette kan også være et krav fra nogle bevillingsgivere, f.eks. i EU's rammeprogram Horizon 2020.

Du kan benytte værktøjet DMPonline til at udarbejde en data management plan.

Hjælp til data management på AAU

Du er velkommen til at kontakte os for yderligere hjælp til håndtering af forskningsdata. Kan vi ikke hjælpe dig, så kan vi henvise dig til andre dele af AAU, der kan bistå med hjælp.