Data publiceren

Data sharing is a key part of the drive towards greater openness in scientific research, allowing readers to reproduce and confirm an article’s findings, or even reuse its data as part of a new study | Federer, 2018

In deze paragraaf laten we een tweetal wegen zien die tot een datapublicatie leiden en zoomen we in op het data paper als vorm van wetenschappelijke output.

Manieren om data te publiceren 

Het publiceren van onderzoeksdata is het vindbaar, citeerbaar en (her)bruikbaar maken van de (meta)data onder een licentie die duidelijk maakt wat er mag en kan met de data. Het publiceren van data wordt door onderzoekers en in de wetenschappelijke literatuur trouwens vaak data sharing genoemd. 

Er zijn grofweg twee manieren om (over) onderzoeksdata te publiceren: 

  • In een data-archief als onafhankelijk, citeerbaar object;
  • Als supplementary material bij een tijdschriftartikel. 

Data die slechts als supplementary material wordt gepubliceerd is minder vindbaar en minder FAIR dan onderzoeksdata die gepubliceerd wordt in een data-archief.

While sharing data as supplementary information is better than not sharing data at all, it is a sub-optimal solution. Data deposited in a repository is more findable and accessible | Baynes, 2018 

Data papers

Naast het publiceren van de data zelf is er de mogelijkheid om een omschrijving van een dataset te publiceren in een data paper. Het data paper is ontstaan als mechanisme om datapublicatie te promoten en data paper citatie mogelijk te maken (Chavan, 2011). Er gaan stemmen op die zeggen dat data papers van het toneel zullen verdwijnen op het moment dat het citeren van de onderliggende datasets standaard is geworden. Maar ook als datacitatie standaard wordt, blijft een data paper waardevol (Callaghan, 2013). Een data paper is eigenlijk een vorm van zeer uitgebreide datadocumentatie en heeft daarmee al bestaansrecht op zichzelf.

Een aantal voorbeelden van data journals waarin data papers worden gepubliceerd:

Het publiceren van de beschreven data in een data-archief is een voorwaarde voor het mogen publiceren in een data paper.

In de spotlight


GBIF: het koppelen van biodiversiteitsdata

Een voorbeeld dat je niet mag missen, is de manier waarop de Global Biodiversity Information Facility (GBIF, n.d.a.) het maken van data papers stimuleert.

Als een onderzoeker of onderzoeksinstituut beschikt over biodiversiteitsdata, in een database of een ander formaat, dan kunnen deze gegevens gekoppeld worden aan het GBIF-netwerk met behulp van de zogeheten GBIF Integrated Publishing Toolkit (IPT) (GBIF. n.d.b.). Via deze Toolkit kunnen ook de metadata worden gepubliceerd als een data paper manuscript, klaar om in te dienen bij een selectie van tijdschriften van Pensoft Publishers. De metadata kunnen makkelijk gedownload worden in een RTF-geformatteerd manuscript dat klaar is om te worden bewerkt en ingediend voor peer review volgens de normale procedures.

Meer weten? Zie het stuk over data papers op de website van GBIF (GBIF, n.d.c.). 

Voorbeelden van data en tijdschriftartikel gekoppeld

  • Een klein voorbeeld van onderzoeksinformatie in context is het artikel 'The initial stages of template-controlled CaCO3 formation revealed by Cryo TEM' (Pouquet, 2009) waarvan de onderzoeksdata (Pouquet, 2010) zijn opgenomen in 4TU.Centre for Research Data (n.d.). Artikel en onderzoeksdata zijn aan elkaar gelinkt. 
  • Van het proefschrift van Bastiaan Wols (Wols, 2010a) zijn de onderliggende onderzoeksdata (Wols, 2010b) opgenomen in 4TU.Centre for Research Data. De data bestaan uit filmpjes van gesimuleerde stroming.

Voor- en nadelen van verschillende datapublicatie routes door CESSDA

CESSDA heeft de voor- en nadelen van verschillende datapublicatie routes in beeld gebracht (CESSDA, 2017). 


Bronnen

Klik om te openen/sluiten

4TU.Center for Research Data (n.d.) https://researchdata.4tu.nl/

Baynes, G. (2016, April 16th). We need more carrots: give academic researchers the support and incentives to share data. LSE Impact Blog [blog]. https://blogs.lse.ac.uk/impactofsocialsciences/2018/04/16/we-need-more-carrots-give-academic-researchers-support-and-incentives-to-share-data/

BMC (n.d.). BMC Research Notes. https://bmcresnotes.biomedcentral.com/about/introducing-data-notes

BRILL (n.d.) Research Data Journal for the Humanities and Social Sciences. https://brill.com/view/journals/rdj/rdj-overview.xml?lang=en

Callaghan, S. (2013, January 29). Citing Bytes - Adventures in Data Ciation. [blog]. Data journals - as soon-to-be-obsolete stepping stone to something better? http://citingbytes.blogspot.co.uk/2013_01_01_archive.html 

CESSDA (2017). Data Management Expert Guide. Data publishing routes. https://www.cessda.eu/Training/Training-Resources/Library/Data-Management-Expert-Guide/6.-Archive-Publish/Data-publishing-routes

Chavan, V., Penev, L. (2011). The data paper: a mechanism to incentivize data publishing in biodiversity science. BMC Bioinformatics, 12 Suppl. 15:S2. http://www.ncbi.nlm.nih.gov/pubmed/22373175

Federer, L. (2018, June 14th). Journal data sharing policies are moving the scientific community towards greater openness but clearly more work remains. LSE Impact Blog [blog]. https://blogs.lse.ac.uk/impactofsocialsciences/2018/06/14/journal-data-sharing-policies-are-moving-the-scientific-community-towards-greater-openness-but-clearly-more-work-remains/

GBIF (n.d.a.). Free and open access to biodiversity data. https://www.gbif.org/

GBIF (n.d.b.). IPT: The Integrated Publishing Toolkit. A free open source software tool used to publish and share biodiversity datasets through the GBIF network. https://www.gbif.org/en/ipt 

GBIF (n.d.c.). Data papers. Getting scholarly recognition for your datasets. https://www.gbif.org/data-papers

Knowledge Exchange. (2013). The value of research data. Metrics for datasets from a cultural and technical point of view. Retrieved from http://repository.jisc.ac.uk/6205/1/Value_of_Research_Data.pdf

DANS (n.d.). NARCIS. https://www.narcis.nl/ 

Pensoft (n.d.). Biodiversity Data Journal. https://bdj.pensoft.net/

Pouget, E.M., Bomans, P.H., Goos, J.A., Frederik, P.M., Sommerdijk, N.A. (2009). The initial stages of template-controlled CaCO3 formation revealed by cryo-TEM. Science. 2009;323: 1455-1458. https://doi.org/10.1126/science.1169434 

Pouget, E.M.(Emilie); Bomans, P.H.H.(Paul); Goos, J.A.C.M.(Jeroen); Frederik, P.M.(Peter); de With (Gijsbertus); Sommerdijk, N.A.J.M.(Nico) (2010). The Initial Stages of Template-Controlled CaCO3 Formation Revealed by Cryo-TEM. Eindhoven University of Technology. Dataset. https://doi.org/10.4121/uuid:29b1a9fa-e8b0-4585-8bb6-fccebc925b68

Sefton P, Lynch M. (2019). Packaging Research data with DataCrate - a cry for help! https://doi.org/10.6084/m9.figshare.8066936.v1 

Ubiquity Press (n.d.a.). Journal of Open Psychology Data. https://openpsychologydata.metajnl.com/

Ubiquity Press (n.d.b.). Journal of Open Archaeology Data. https://openarchaeologydata.metajnl.com/

Ubiquity Press (n.d.c.). Journal of Open Health Data. http://openhealthdata.metajnl.com/

Wiley (n.d.a.). Brain and Behavior. https://onlinelibrary.wiley.com/page/journal/21579032/homepage/data_set.htm

Wiley (n.d.b.) Geoscience Data Journal. https://rmets.onlinelibrary.wiley.com/journal/20496060

Wols, B. (2010a). CFD in drinking water treatment. Doctoral thesis. https://doi.org/10.4233/uuid:b1d4405e-a364-4105-ab03-21800b46df5b 

Wols, B.A. (Bas) (2010b) CFD in drinking water treatment. 4TU.Centre for Research Data. Dataset. https://doi.org/10.4121/uuid:c1ac7344-1419-4398-ba13-c757551c303f

Zenodo (n.d.) https://zenodo.org/