Data citeren en data-impact

"Data citation is the practice of providing a reference to data in the same way as researchers routinely provide a bibliographic reference to other scholarly resources." - ANDS(1)

 

   Hoofdlijnen

De publicatie van datasets telt steeds meer mee als citeerbare bijdrage aan het onderzoekscurriculum. DataCite zet zich hier onder andere voor in. 

Het kunnen citeren van onderzoeksdata is van belang voor:

  • De vindbaarheid.
  • Het geven van credit (impact).
    • Credit geven betekent dat je de relatie tussen de data en de onderzoeker die ze produceerde goed documenteert.
    • Onderzoekers kunnen hun onderzoeksdata koppelen aan hun ORCID-id(2) (ORCID-id (3)is een persistent author identifier).
    • Het citeren van onderzoeksdata maakt onderdeel uit van de Altmetrics(4) (alternative metrics) beweging die stelt dat de impact van je onderzoek bepaald wordt door de verwijzingen naar een breed scala aan onderzoeksoutput zoals datasets, software, blogposts, presentaties, tweets, etc. Neem bijvoorbeeld het citeren van code.

FORCE 11(5) maakt zich sterk voor datacitatie en publiceerde een manifest met een aantal datacitatie principes(6) die het belang en de ingrediënten van een datacitatie op de agenda zetten. Dit soort initiatieven beïnvloeden de status quo en helpen om te bouwen aan een cultuur van datacitatie.  

In de video hieronder passeren de diverse elementen die bij datacitatie komen kijken de revue.



RDNL-video over datacitatie; zet op HD-kwaliteit voor de beste kijkervaring.

Voordelen

Een tabel met de voordelen van datacitatie voor de korte en langere termijn is ontleend aan de 'Datacite Implementation Recommendations'(7), geschreven door de Datacite Taskforce.

Voordelen op de korte termijn Voordelen op de lange termijn
Gemakkelijk om data te localiseren Creëert een publicatiestructuur die lange termijn beschikbaarheid van data mogelijk maakt
Makkelijker om data her te gebruiken en te verifiëren Datacitatie maakt het ontdekken van data makkelijker
Maakt het makkelijker credits te geven aan de rechtmatige dataproducent Mogelijke rechtvaardiging om subsidies toe te kennen
Bevordert het reproduceren van onderzoek De impact van datasets en dataproducenten kan gemeten worden

Persistent identifiers

Om citatie van datasets mogelijk te maken moeten ze over een persistent identifier beschikken. Een persistent identifier is een uniek label dat gekoppeld is aan een digitaal object. Hierdoor kan het object altijd gevonden worden, ook bij veranderingen van naam en plaats. Zo voorkom je het ontstaan van gebroken links of een page not found. Dankzij een persistent identifier is een object altijd en overal eenduidig refereerbaar (citeerbaar) en vindbaar.

Er zijn verschillende persistent identifier systemen, bijv. URN, PURL, ARK en DOI. Afhankelijk van het doel kunnen aan een object verschillende persistent identifiers toegekend worden.

De DOI

In dit kader herhalen we wat er in de video over datacitatie aan bod kwam.

Een DOI (Digital Object Identifier) is bij uitstek geschikt om een digitaal object citeerbaar te maken en wordt alleen toegekend aan objecten die voor de lange termijn beheerd en toegankelijk blijven.  DOI's worden al veel gebruikt in de wetenschappelijke literatuur om naar tijdschriftartikelen te linken. Door een DOI toe te kennen aan een dataset, maak je de herkomst herleidbaar en citeerbaar.

DOI's worden steeds meer geaccepteerd als de persistent identifier naar keuze als het op datacitatie aankomt. Dat merk je onder andere doordat systemen die andere persistent identifiers aanbieden daarnaast ook DOI's gaan aanbieden. Dataverse Network bood eerst alleen Handle en gaat nu over(8) op DOI's. Ook DANS biedt naast URN's DOI's aan.

Structuur van een DOI 

De DOI bestaat uit twee delen:

  • een prefix (voorvoegsel) bestaande uit het getal '10' gevolgd door 4 of meer cijfers;
  • en een suffix (achtervoegsel);
  • die gescheiden zijn door een schuine streep.

De identificatiecode in het voorvoegsel staat voor diegene die de dataset geregistreerd heeft. Na de schuine streep volgt de identifier voor de dataset.

Voorbeeld van een DOI: 10.4121/uuid:c1ac7344-1419-4398-ba13-c757551c303f.

Registratie

DOI’s worden geregistreerd via DataCite en in Nederland via DataCite Netherlands.(9) Een onderzoeker krijgt een DOI voor zijn dataset zodra hij zijn dataset deponeert in data-archief die klant is bij DataCite. Dan registreert de instelling de DOI voor de dataset die door de instelling zelf gearchiveerd wordt. Je kunt als individuele onderzoeker geen DOI registreren. Dit is algemeen beleid van DataCite.

Wanneer een DOI wordt geregistreerd is het verplicht om een minimale set metadata aan te leveren. Alle verplichte, optionele en aanbevolen metadata staan beschreven in het DataCite Metadata Scheme.(10) Alle toegekende metadata worden opgeslagen in de zogeheten DataCite Metadata Store(11) en zijn daarmee afzoekbaar.

Citatie

DataCite adviseert(12) hoe je een dataset moet citeren als je deze in een publicatie vermeldt. De aanbevolen citatiestijl is:

Creator (PublicationYear): Title. Publisher. Identifier

Dat ziet er dan bijvoorbeeld voor deze dataset(13) in 4TU.Centre for Research Data zo uit: 

Zie ook: Persistent identifiers bij 4TU.Centre for Research Data en DANS.

   Bronnen en verder lezen

Klik om te openen/sluiten

Bronnen

  1. ANDS. Data citation awareness. Retrieved from http://ands.org.au/guides/data-citation-awareness.html
  2. ORCID. (2013, June 17). Connecting research datasets and researchers: ORCID use cases and integrations. [blog]. Retrieved from http://orcid.org/blog/2013/06/17/connecting-research-datasets-and-researchers
  3. ORCID-ID. Retrieved from http://orcid.org/
  4. Altmetrics: a manifesto. (2010). Retrieved from http://altmetrics.org/manifesto/
  5. FORCE 11. Retrieved from http://www.force11.org/about
  6. FORCE 11. (2013). Data citation principles. Retrieved from https://www.force11.org/about/manifesto
  7. DataCite Task Force. (2013). DataCite Implementation Recommendations. A report of the DataCite Task Force. Retrieved from https://deepblue.lib.umich.edu/bitstream/handle/2027.42/100249/DataCiteTaskForceReport.pdf?sequence=1
  8. The Dataverse Network Project. (2013). DOIs - coming to a dataverse near you. Retrieved from http://thedata.org/blog/dois-coming-dataverse-near-you
  9. DataCite Netherlands. Retrieved from http://datacite.tudelft.nl/info/home/
  10. Datacite. Datacite metadata schema v 3.0. Retrieved from http://schema.datacite.org/meta/kernel-3/index.html
  11. Datacite. Datacite metadata store. Retrieved from https://mds.datacite.org/
  12. Datacite. Why cite data? Retrieved from https://www.datacite.org/cite-your-data.html
  13. Keen, A.S. (2011). Erosive Bar Migration Using Density and Diameter Scaled Sediment Erosive Profile Set-Prototype Scale (Actual Scal 1:10). TU Delft. data.4tu.nl/repository/uuid:32c53005-a4f2-447c-b231-6cdb7dcdd17f

Verder lezen

 

 


botMessage_toctoc_comments_9210