Data archiveren

"Early interaction with the data repository was paramount to our success." - Purdue University(1)

  Hoofdlijnen

Data archiveren in stappen 

De infrastructuur die het mogelijk maakt om onderzoeksdata te delen is gelaagd:

 • Eerst slaat een onderzoeker zijn of haar data lokaal op of in een datalab. Vaak zijn de data dan nog niet zichtbaar voor anderen.
 • Het instituut slaat de data op voor de korte termijn, bijvoorbeeld in een institutioneel repository
 • Na selectie worden de data opgeslagen in een data-archief zoals bijvoorbeeld 4TU.Centre for Research Data of EASY.
  De data kunnen onder verschillende voorwaarden ter beschikking gesteld worden: onder embargo, closed access of open access. In alle gevallen is er sprake van een datapublicatie.De meest optimale vorm van beschikbaarstelling van de datapublicatie is open access, want dan zijn de data zonder beperkingen te gebruiken.

Om de gelaagdheid te visualiseren spreken ze op de Edinburgh Research Data blog over 'The four quadrants of research data curation systems'.(2) 

Waar onderzoeksprojecten vaak een korte doorlooptijd hebben, richten data-archieven zich juist op continuïteit. Denk hierbij aan: 

 • Langetermijnbewaring.
  Dit is ten behoeve van datahergebruik.
 • Faciliteren van interoperabiliteit.
  Om datasets met elkaar te kunnen vergelijken en te combineren, is het van belang dat metadata consistent worden toegekend en er gebruik gemaakt wordt van metadatastandaarden en standaard dataformaten
 • Faciliteren van een datacitatienetwerk.
  Het kunnen citeren van data en het koppelen van data en literatuur leidt tot meer transparantie in de wetenschapsbeoefening en ondersteunt wetenschappelijke integriteit.

In de WhitePaper 'Sustaining Domain Repositories for Digital Data'(3) worden de rollen van data-archieven uitgebreid omschreven.

Data-archieven

In onderstaande accordeon staat een aantal categorieën data-archieven met één of meer voorbeelden per categorie. In de paragraaf zoeken naar data gaan we nader in op het vinden van geschikte data-archieven.

Institutioneel data-archief
 • 4TU.Centre for Research Data (4) is opgericht als data-archief voor de drie technische universiteiten in Nederland: TU Delft, TU Eindhoven en Universiteit Twente maar staat inmiddels ook open voor data van andere universiteiten. Daarmee is 4TU.Centre for Research Data haar status als institutioneel data-archief voorbij.
 • Edinburgh Datashare(5) is een data-archief bestemd voor de datasets van onderzoekers van The University of Edinburgh.
Nationaal/Europees data-archief

Nationaal

 • EASY(6), het online archiveringssysteem van DANS, richt zich van origine vooral op de geesteswetenschappen en sociale wetenschappen maar staat inmiddels ook open voor andere disciplines.

Europees

 • Zenodo(7) is een Europees repository voor zogeheten 'orphan data':  als een onderzoeker niet kan beschikken over een institutioneel of discipline-specifiek data-archief kan hij hier terecht.
  Als deelnemers aan de Open data pilot van Horizon 2020 geen gebruik kunnen maken van een data-archief dan kunnen ze ook Zenodo gebruiken.(8)
Discipline-specifiek data-archief
 • Life sciences algemeen.
 • Life sciences specifiek: DNA sequenties 

 

 

Onderzoeksoutput-specifiek

Bij data archieven die gericht zijn op een bepaalde type onderzoeksoutput kun je denken aan software repositories(13) zoals:

Algemene data-archieven

   Casus Wageningen Universiteit

Bij het oversluizen van onderzoeksdata van instelling naar data-archief werkt de universiteitsbibliotheek van Wageningen Universiteit samen(20) met DANS en 4TU.Centre for Research Data.

In een dubbel-interview(21) met onderzoeker Frits van Evert (Agrosystems Research) en bibliotheekmedewerker Annemarie Patist, wordt duidelijk hoe dat ongeveer in zijn werk gaat:

"The E-depot does now have data sets, but they won't stay there! We are working on sustainably archiving datasets , accompanied by a 'read me file' and a 'methodology file' in national archives like DANS (Data Archiving and Network Services) and 4TU.Centre for Research Data Delft. The data has to remain available over the long term. That’s why the data are converted into sustainable formats before they are sent to the national archives. The formats are independent of specific versions of software. After the datasets are checked by DANS or 3TU Datacenter employees, they are published. The persistent link received from the archive centre is then the only thing that is stored in the E-depot."

De samenwerking is een voorbeeld van hoe het het frontoffice - backoffice model van Research Data Netherlands in de praktijk kan uitwerken.

   Bronnen en verder lezen

Klik om te openen/sluiten

Bronnen

 1. Zilinski, L.D. (2013). Evaluation of data creation, Management, Publication, and Curation in the Research Process [conference paper]. Retrieved from https://www.researchgate.net/publication/275019794_Evolution_of_Data_Creation_Management_Publication_and_Curation_in_the_Research_Process
 2. Lewis, S. (2013, December 6). The four quadrants of research data curation systems. [blog]. Retrieved from
 3. Ember, C. (2013). Sustaining Domain Repositories for Digital Data: A White Paper. Retrieved from http://datacommunity.icpsr.umich.edu/sites/default/files/WhitePaper_ICPSR_SDRDD_121113.pdf
 4. 4TU.Centre for Research Data. Retrieved from http://researchdata.4tu.nl/home/
 5. Edinburgh DataShare. Retrieved from http://datashare.is.ed.ac.uk/
 6. EASY. Retrieved from https://easy.dans.knaw.nl/ui/home
 7. Zenodo. Retrieved from https://www.zenodo.org/ 
 8. OpenAIRE. Open access to research data: the Open Research Data Pilot. Retrieved from https://www.openaire.eu/what-is-the-open-research-data-pilot 
 9. CLARIN. Retrieved from http://www.clarin.eu/ 
 10. Search resources at CLARIN in Europe. Retrieved from http://www.meertens.knaw.nl/cmdi/search/#q=*%3A*
 11. Dryad data repository. Retrieved from datadryad.org
 12. Genbank. Retrieved from http://www.ncbi.nlm.nih.gov/genbank/
 13. Khodiyar, V., (2013, October 11). Open access software: Our recent software repository collaborations. [blog]. Retrieved from http://blog.f1000research.com/2013/10/11/open-access-software-our-recent-software-repository-collaborations/ 
 14. Github. Retrieved from github.com
 15. Github Education. Retrieved from https://education.github.com/
 16. Runmycode. Retrieved from http://www.runmycode.org/ 
 17. Research Compendia. Retrieved from researchcompendia.org/
 18. Figshare. Retrievedfrom http://www.figshare.com/
 19. Maxmen, A. (2013, August 1). Preserving Research. The top online archives for storing your unpublished findings. The scientist. Retrieved from http://www.the-scientist.com/?articles.view/articleNo/36695/title/Preserving-Research/
 20. DANS. WUR kiest voor duurzame data-opslag bij DANS en 3TU. Retrieved from http://www.dans.knaw.nl/nl/actueel/nieuws/wur-kiest-voor-duurzame-data-opslag-bij-dans-en-3tu
 21. WUR. Data archiving: a double interview. Retrieved from http://www.wageningenur.nl/en/show/Dataarchivingdoubleinterview.htm

Verder lezen


botMessage_toctoc_comments_9210