Data publiceren

   Hoofdlijnen

Voor een data supporter is het essentieel om te weten dat de manier waarop onderzoekers publiceren aan het veranderen is.

Publicaties, datasets en andere typen onderzoeksinformatie worden vaak als losse typen informatie opgeslagen en getoond. Toch hebben ze veel met elkaar te maken. Door de gerelateerde informatie aan elkaar te linken ontstaat een zogeheten Scientific Publication Package, een term bedacht door Jane Hunter(2). Denk hierbij aan het combineren van de publicatie en onderliggende datasets, beelden, modellen, visualisaties, rapporten, documentatie, bijlagen en links naar gerelateerd onderzoek.

Er zijn grofweg drie manieren om onderzoeksdata te publiceren: 

 • In een data-archief als onafhankelijk object.
 • Als een omschrijving van de dataset in een data paper.
 • Als onderdeel in een web van relaties.

(Lees hierover ook het hoofdstuk 'Open Research Data: From Vision to Practice'(1) in het boek 'Opening Science').

Kort geleden spraken we nog over een 'verrijkte publicatie', maar daar heeft eigenlijk niemand het meer over. Het is een teken van de snelle veranderingen in het vakgebied waar jij als data supporter werkzaam bent. Wat blijft is de insteek diverse informatiebronnen op een betekenisvolle manier aan elkaar te koppelen. Dynamiek is hierbij een cruciaal gegeven. De inhoud van een publicatie is niet langer lineair: "Het is een netwerk van onderdelen waar de lezers zelf een eigen optimale route in kunnen bepalen".(3)

De dynamische publicatie heeft onherroepelijk zijn intrede gedaan (zie ook het hoofdstuk 'Dynamic Publication Formats and Collaborative Authoring'(4) in het boek 'Opening Science').

Een belangrijke randvoorwaarde bij het leggen van relaties tussen digitale objecten is dat alle objecten die aan elkaar gerelateerd zijn, over een persistent identifier beschikken. Je leert hier meer over in de paragraaf Datacitatie.
Om onderlinge relaties tussen objecten, zoals data, publicatie en onderzoeker te formuleren kan gebruik worden gemaakt van specificaties die onderdeel zijn van het 'Resource Description Framework' (RDF). Door digitale objecten vast te leggen als linked data, maak je een web van relaties mogelijk (zie digitale objecten en datamodellen).

Data papers en data journals

Het data paper is ontstaan als mechanisme(5) om datapublicatie te promoten en data paper citatie mogelijk te maken. Er gaan stemmen op die zeggen dat data papers van het toneel zullen verdwijnen op het moment dat het citeren van de onderliggende datasets standaard is geworden. Maar ook als datacitatie standaard wordt, blijft een data paper waardevol zo redeneert Sarah Callaghan.(6) Een data paper is eigenlijk een vorm van zeer uitgebreide datadocumentatie en heeft daarmee al bestaansrecht op zichzelf.

Een aantal voorbeelden van data journals:

   Cases

 • Een klein voorbeeld van onderzoeksinformatie in context is het artikel (12) 'The initial stages of template-controlled CaCO3 formation revealed by Cryo TEM' waarvan de onderzoeksdata(13) zijn opgenomen in 4TU.Centre for Research Data. Artikel en onderzoeksdata zijn aan elkaar gelinkt. 
 • Van het proefschrift van Bastiaan Wols(14) zijn de onderliggende onderzoeksdata(15) opgenomen in 4TU.Centre for Research Data. Die bestaan uit filmpjes van gesimuleerde stroming.
 • In NARCIS(16) worden ‘verrijkte publicaties’ als apart informatietype opgenomen. In de verrijkte publicatie van Richard Zijdeman 'Like my father before me'(17): intergenerational occupational status transfer during industrialization (Zeeland, 1811-1915)’ worden relaties gelegd tussen onder andere een artikel uit de repository van de Universiteit Utrecht en de bijbehorende datasets die zijn opgenomen in EASY.
  De verrijkte publicaties in Narcis zijn een experiment met het visualiseren van een web van relaties. Deze manier van het visualiseren van onderzoeksoutput lijkt op het 'oude' publiceren: wat je doet heeft een begin en einde, kop en staart, alles lijkt op één plek bij elkaar te staan. Dit laatste is maar schijn, want de kracht van onderzoeksinformatie in context is nu juist dat de aan elkaar gerelateerde bronnen zich overal kunnen bevinden. Bovendien geeft de eerder beschreven dynamiek al aan dat de relaties in de tijd kunnen wijzigen.
 • OpenAIRE(18) wil een infrastructuur zijn die zich richt op(19) het linken van publicaties, project informatie, onderliggende datasets, auteursinformatie enzovoort resulterend in een contextuele presentatie van onderzoeksoutput. OpenAIRE maakt gebruik van het OAI-PMH protocol(20) voor het 'oogsten' van metadata. Dat is een belangrijke voorwaarde voor interoperabiliteit tussen data archieven en repositories.

  De diepte in

   Bronnen

Klik om te openen/sluiten

Bronnen

 1. Pampel, H.; Dallmeier-Tiessen, S. (2014). Open Research Data: From Vision to Practice. In Opening Science (pp. 213-224). Springer Link. Retrieved from http://dx.doi.org/10.1007/978-3-319-00026-8_14
 2. Hunter, J. (2006). Scientific Publication Packages - a selective Approach to the Communication and Archival of Scientific Output. The International Journal of Digital Curation, 1 (1), 33-52. Retrieved from http://www.ijdc.net/index.php/ijdc/article/view/8 
 3. SURFshare. (2010). Verrijkte publicaties. Onderzoeksresultaten in samenhang. Retrieved from http://www.surf.nl/kennisbank/2010/boek-verrijkte-publicaties-onderzoeksresultaten-in-samenhang.html
 4. Heller, L.; The, R.; Bartling, S. (2014). Dynamic Publication Formats and Collaborative Authoring. In Opening Science (pp. 191-211). Springer Link. Retrieved from http://dx.doi.org/10.1007/978-3-319-00026-8_13 
 5. Chavan, V.; Penev, L. (2011). The data paper: a mechanism to incentivize data publishing in biodiversity science. BMC Bioinformatics, 12 Suppl. 15:S2. Retrieved from http://www.ncbi.nlm.nih.gov/pubmed/22373175
 6. Callaghan, S. (2013, January 29). Citing Bytes - Adventures in Data Ciation. [blog]. Data journals - as soon-to-be-obsolete stepping stone to something better? Retrieved from http://citingbytes.blogspot.co.uk/2013_01_01_archive.html 
 7. Brain and Behavior (Wiley). Retrieved from http://onlinelibrary.wiley.com/journal/10.1002/%28ISSN%292157-9032/homepage/data_set.htm
 8. Geoscience data journal (Wiley). Retrieved from http://onlinelibrary.wiley.com/journal/10.1002/%28ISSN%292049-6060
 9. Biodiversity data journal (Pensoft). Retrieved from http://biodiversitydatajournal.com/
 10. Callaghan, S. A list of data journals (in no particular order). Retrieved from http://proj.badc.rl.ac.uk/preparde/blog/DataJournalsList
 11. Journal of open psychology data (upmetajournals). Retrieved from http://openpsychologydata.metajnl.com/
 12. Sommerdijk. N.A.J.M., e.a. (2009). The Initial Stages of Template Controlled CaCO3 Formation Revealed by Cryo-TEM, Science, 323(5920), 1455-1458. Retrieved from http://dx.doi.org/10.1126/science.1169434
 13. Pouget, E.M.; Bomans, P.H.H.; Goos, J.A.C.M.; Frederik, P.M.; de With, G.; Sommerdijk, N.A.J.M.. (2010) The Initial Stages of Template-Controlled CaCO3 Formation Revealed by Cryo-TEM. Eindhoven University of Technology. [dataset]. https://data.4tu.nl/repository/uuid:29b1a9fa-e8b0-4585-8bb6-fccebc925b68
 14. Wols, B.A. (2010). CDF in drinking water treatment. [dissertation]. Retrieved from https://repository.tudelft.nl/islandora/object/uuid:b1d4405e-a364-4105-ab03-21800b46df5b?collection=research
 15. Wols, B.A. (2010). CFD in drinking water treatment. Delft University of Technology. [dataset]. https://data.4tu.nl/repository/uuid:c1ac7344-1419-4398-ba13-c757551c303f
 16. NARCIS. Retrieved from http://www.narcis.nl/ 
 17. Zijdeman. R.L. (2009). Like my father before me: intergenerational occupational status transfer during industrialization. [verrijkte publicatie]. Retrieved from http://www.narcis.nl/vpub/RecordID/escape-demo%3Arem%3A2679/id/1/Language/NL
 18. OpenAIRE. Retrieved from https://www.openaire.eu/
 19. OpenAIRE.  OpenAIRE compatible data sources. Retrieved from https://explore.openaire.eu/search/find/dataproviders
 20. Open Archives Initiative Protocol for Metadata Harvesting. Retrieved from http://www.openarchives.org/pmh/
 21. Manghi, P., e.a. (2012). OpenAIREplus: the European Scholarly Communication Data Infrastructure. D-lib magazine, 18 (9/10). Retrieved from http://www.dlib.org/dlib/september12/manghi/09manghi.html
 22. Schirrwagen, J. e.a. (2013). Data curation in the OpenAIRE scholarly communication. Information Standards Quarterly, 25(3), 13-19. Retrieved from http://www.niso.org/apps/group_public/download.php/11600/IP_Schirrwagen_etal_OpenAireisqv25no3..pdf

Verder lezen

  Jouw toevoegingen

Hoe kun je de kennis uit deze paragraaf gebruiken in een gesprek met een onderzoeker? Zijn er data papers op het vakgebied dat jij ondersteunt? Heb je andere toevoegingen op deze pagina? In de comments kun je jouw opmerkingen kwijt.


botMessage_toctoc_comments_9210