Showcases

I totally agree that we, as data supporters, should expect the question ‘What is in it for me?’. It might indeed be useful to have testimonials at your disposal, but I would rather have some ‘evidence’ in the form of scientific papers (or data, of course) that - preferably - shows a citation advantage for data sharing | Cursist Essentials 4 Data Support 

Als data supporter kun je een onderzoeker adviseren over maatregelen die genomen kunnen worden om integer en reproduceerbaar te werken en FAIR data af te leveren. Je kunt daarbij de vraag "What is in it for me?" verwachten. Als je die vraag krijgt, kan het helpen om testimonials en wetenschappelijke bewijsstukken ter beschikking te hebben waaruit blijkt wat het andere onderzoekers heeft opgeleverd. In deze paragraaf zetten we er een aantal voor je klaar. 

Onderzoekers aan het woord

Hieronder kun je een aantal testimonials van onderzoekers bekijken. Waarom vinden zij reproduceerbaarheid, open science en FAIR datamanagement belangrijk? 

  • Open science
    Onderstaande video, die deel uitmaakt van de Open Science MOOC (n.d.), laat een aantal onderzoekers aan het woord over wat open science voor hen in de praktijk betekent.  

  • Reproduceerbaar werken 
    Patrick Vandewalle zijn ervaringen met reproduceerbaar werken, waaronder het delen van software en code.  

Ben je benieuwd over welke tools Patrick sprak?

Dat waren RunMyCode en ResearchCompendia.
Je kunt ook zijn artikelen over reproducible research lezen:

  • Het publiceren van onderzoeksdata
    Onderstaande showcases laten zien waarom onderzoekers ervoor kiezen om hun data te publiceren in een data-archief. In dit geval in 4TU.Centre for Research Data (n.d.).  
     


De wetenschap die spreekt

Het antwoord op de vraag wat andere onderzoekers (dan degene die je voor je hebt) motiveert om data te delen, is deels in de wetenschappelijke literatuur vinden. Verschillende onderzoeken (bijvoorbeeld Van den Eynden & Bishop, 2014; Digital Science, 2017Houtkoop, 2018; Zuiderwijk & Spiers, 2019) laten namelijk afzonderlijk zien dat daar drie hoofdredenen zijn: 

1. Het delen van data leidt tot een verhoogde zichtbaarheid en een citatievoordeel

Al vanaf 2007 verschijnen er wetenschappelijke studies die aantonen aan dat het publiceren van onderzoeksdata leidt tot verhoogde zichtbaarheid, hergebruik en citatie en dus erkenning van wetenschappelijk werk (Piwowar, 2007). De volgende studies bevestigen dit effect:

Uit onderzoek van Colavizza et al. (2019) blijkt dat het citatievoordeel groter is als de onderliggende data ook echt gepubliceerd zijn in een data-archief en niet alleen maar als supplementary material.

Wil je zoeken naar data over data sharing? Probeer het eens in Google Dataset Search (n.d.) of via een van de andere strategieën in de paragraaf 'Zoeken naar data'.

2. Het delen van data is goed voor de wetenschap zelf

Het publiceren van data heeft directe voordelen voor het onderzoek zelf, voor de wetenschapsdiscipline en voor de wetenschap in het algemeen door nieuwe samenwerkingen en nieuwe soorten gebruik van bestaande data mogelijk te maken. Ook is het delen van data een voorwaarde om een onderzoek te kunnen verifiëren of reproduceren en dat leidt tot vertrouwen in de wetenschap. Daarnaast worden er minder middelen en tijd verspild als data opnieuw worden gebruikt. 

Hoewel het theoretisch heel aannemelijk is dat data delen goed is voor de wetenschap, blijkt in de praktijk dat voorbeelden van hergebruik makkelijker te vinden zijn in de big sciences waar vaak al een infrastructuur bestaat waar verantwoord databeheer hoog in het vaandel staat. Denk bijvoorbeeld aan de Hubbletelescoop (Hubblesite, n.d.). De observaties die met deze telescoop uitgevoerd worden, kosten veel geld en kunnen maar één keer gedaan worden. Deze data worden op grote schaal hergebruikt (NASA, 2011a). Andere voorbeelden:

  • Bij heranalyse van oude data (NASA, 2011b) ontdekken NASA-onderzoekers een nieuwe planeet.
  • Bij heranalyse van RNA-sequentie data ontdekken onderzoekers zogeheten fusion genes (Kangaspeska, 2012).
  • Onderzoekers konden uit oude observaties van de plekken waar walvissen in het Noordpoolgebied werden gevangen conclusies trekken over het toenmalige klimaat (de la Mare, 1997).
  • Sinds eind 2010 kent DANS EASY een vorm van peer review. Uit de gegevens van één van de gereviewde datasets (DANS, n.d.) kun je aflezen dat 3 van de 8 gebruikers van plan zijn de data te gebruiken voor een eigen publicatie. 

Voorbeelden van hergebruik van onderzoeksdata kunnen een aansporing zijn voor onderzoekers om hun onderzoeksdata ook ter beschikking te stellen. Het hergebruik van data wordt via wetenschappelijk weg nog onvoldoende in kaart gebracht (Pasquetto, 2017). 

3. Derden vereisen het

Onderzoeksfinanciers en uitgevers hebben een aanzienlijke invloed op het delen van onderzoeksdata. Zie de paragraaf databeleid voor meer informatie.

Research data published from 2007 onwards have gradually attracted more citations reflecting a bias towards more recent research data which might be due to the awareness of and demand for research data reuse | Fecher, 2015 

Bronnen

Klik om te openen/sluiten

4TU.Centre for Research Data (n.d.). https://researchdata.4tu.nl/en/

Belter, C.W. (2014). Measuring the Value of Research Data: A Citation Analysis of Oceanographic Data Sets. PLoS ONE 9(3): e92590.https://doi.org/10.1371/journal.pone.0092590

Botstein, D. (2010). It’s the data! Molecular Biology of the Cell, 21(1), pp.4–6. https://doi.org/10.1091/mbc.E09-07-0575

Digital Science. Hahnel, M., Treadway, J., Fane, B., Kiley, R., Peters, D., Baynes, G. (2017). The State of Open Data Report 2017. https://doi.org/10.6084/m9.figshare.5481187.v1

DANS (n.d.). Detailed reactions for 'Bestand Bodemgebruik 2006 - BBG'06'. Retrieved from http://datareviews.dans.knaw.nl/details.php?l=en&pid=urn:nbn:nl:ui:13-0an-1ei

DANS (2013). Data delen: goed voor de wetenschap, goed voor u. [video] https://youtu.be/DLt0xLyMEVw

Dorch, B. (2012). On the citation advantage of linking to data: Astrophysics. http://hprints.org/docs/00/71/47/34/PDF/Dorch_2012a.pdf

Fecher, B., Friesike, S., & Hebing, M. (2015). What drives academic data sharing? PLoS One, 10(2), e0118053. https://doi.org/10.1371/journal.pone.0118053

Goodman, A., e.a. (2014). 10 Simple Rules for the Care and Feeding of Scientific Data. Retrieved from http://arxiv.org/pdf/1401.2134v1.pdf

Google Dataset Search (n.d.). https://toolbox.google.com/datasetsearch/ 

Henneken, E.A. & Accomazzi, A. (2011). Linking to data - effect on citation rates in astronomy, Digital Libraries; Instrumentation; Methods for Astrophysics. http://arxiv.org/abs/1111.3618v1

Houtkoop, B.L., Chambers, C., Macleod, M., Bishop, D.V.M., Nichols, T.E., Wagenmakers, E-J. (2018). Data sharing in pyschology; A survey on barriers and preconditions. https://doi.org/10.1177/2515245917751886

Hubble Site (n.d.). Retrieved from hubblesite.org

Kangaspeska, S., Hultsch, S., Edgren, H., Nicorici, D., Murumägi, A., Kallioniemi, O. (2012). Reanalysis of RNA-Sequencing Data Reveals Several Additional Fusion Genes with Multiple Isoforms. PLoS ONE 7(10): e48745. https://doi.org/10.1371/journal.pone.0048745 

Mare, W.K. de la. (1997). Abrupt mid-twentieth centry decline in Antarctic sea-ice extent from whaling records. Nature, 389, 57-60. https://doi.org/10.1038/37956

NASA. (2011a). Hubble racks up 10,000 science papers [News] https://hubblesite.org/contents/news-releases/2011/news-2011-40.html

NASA. (2011b). Astronomers find elusive planets in decade-old Hubble data. http://www.nasa.gov/mission_pages/hubble/science/elusive-planets.html

Pasquetto, I.V., Randles, B.M. and Borgman, C.L., 2017. On the Reuse of Scientific Data. Data Science Journal, 16, p.8. https://doi.org/10.5334/dsj-2017-008 

Pienta, A.M., Alter, G. C. & Lyle, J.A. (2010). The Enduring Value of Social Science Research: The Use and Reuse of Primary Research Data. Retrieved from http://hdl.handle.net/2027.42/78307

Piwowar, H.A., Day, R.S., Fridsma, D.B. (2007) Sharing Detailed Research Data Is Associated with Increased Citation Rate. PLoS ONE 2(3): e308. https://doi.org/10.1371/journal.pone.0000308

Piwowar, H.A., Vision, T.J. (2013). Data reuse and the open data citation advantage. PeerJ1:e175. https://doi.org/10.7717/peerj.175

Runmycode (n.d). Retrieved from http://www.runmycode.org/

Research Compendia (n.d.). See notice on http://www.re3data.org/repository/r3d100010758

SPARC Europe (n.d.).European Open Data Champions. https://openscholarchampions.eu/opendata/

Untrecht University (n.d.). RDM Support. RDM Stories. https://www.uu.nl/en/research/research-data-management/rdm-stories

Van den Eynden, V., Knight, G., Vlad, A., Radler, B., Tenopir, C., Leon, D. et al. (2016): Survey of Wellcome researchers and their attitudes to open research. figshare. Paper. https://doi.org/10.6084/m9.figshare.4055448.v1

Vandewalle, P., Kovacevic, J., Vetterli, M. (2009). Reproducible Research in Signal Processing - What, why, and how. IEEE Signal Processing Magazine, 26 (3). pp. 37-47. https://doi.org/10.1109/MSP.2009.932122

Vandewalle, P. (2012). Code Sharing is Associated with Research Impact in Image Processing. IEEE Computing in Science and Engineering, 14 (4). pp. 42-47. https://doi.org/10.1109/MCSE.2012.63

Wicherts (2019). The citation advantage of linking publications to research data. https://arxiv.org/pdf/1907.02565.pdf

Zuiderwijk, A., Spiers, H. (2019). Sharing and re-using open data: A case study of motivations in astrophysics. International Journal of Information Management. Volume 49, pages 228-241. https://doi.org/10.1016/j.ijinfomgt.2019.05.024