Print Pages

Access Page via Rule

Track Page Visit

Visited Pages JQuery

Navigatie Hoofstuk IV Hoofdstuk I Hoofdstuk II Hoofdstuk III Hoofdstuk IV Hoofdstuk V Hoofdstuk VI
Navigatie HIV tablet I II III IV V VI
Navigatie Hoofdstuk IV mobiel I II III IV V VI

Data citeren en data-impact

"Data citation is the practice of providing a reference to data in the same way as researchers routinely provide a bibliographic reference to other scholarly resources." - ANDS(1)

   Hoofdlijnen

De publicatie van datasets telt steeds meer mee als citeerbare bijdrage aan het onderzoekscurriculum. DataCite zet zich hier onder andere voor in. 

Het kunnen citeren van onderzoeksdata is van belang voor:

  • De vindbaarheid.
  • Het geven van credit (impact).
    • Credit geven betekent dat je de relatie tussen de data en de onderzoeker die ze produceerde goed documenteert.
    • Onderzoekers kunnen hun onderzoeksdata koppelen aan hun ORCID-id(2) (ORCID-id (3)is een persistent author identifier).
    • Het citeren van onderzoeksdata maakt onderdeel uit van de Altmetrics(4) (alternative metrics) beweging die stelt dat de impact van je onderzoek bepaald wordt door de verwijzingen naar een breed scala aan onderzoeksoutput zoals datasets, software, blogposts, presentaties, tweets, etc. Neem bijvoorbeeld het citeren van code.

FORCE 11(5) maakt zich sterk voor datacitatie en publiceerde een manifest met een aantal datacitatie principes(6) die het belang en de ingrediënten van een datacitatie op de agenda zetten. Dit soort initiatieven beïnvloeden de status quo en helpen om te bouwen aan Initiates file downloadeen cultuur van datacitatie.  

In de video hieronder passeren de diverse elementen die bij datacitatie komen kijken de revue.



RDNL-video over datacitatie; zet op HD-kwaliteit voor de beste kijkervaring.

Voordelen

Een tabel met de voordelen van datacitatie voor de korte en langere termijn is ontleend aan de 'Datacite Implementation Recommendations'(7), geschreven door de Datacite Taskforce.

Voordelen op de korte termijn Voordelen op de lange termijn
Gemakkelijk om data te localiserenCreëert een publicatiestructuur die lange termijn beschikbaarheid van data mogelijk maakt
Makkelijker om data her te gebruiken en te verifiërenDatacitatie maakt het ontdekken van data makkelijker
Maakt het makkelijker credits te geven aan de rechtmatige dataproducentMogelijke rechtvaardiging om subsidies toe te kennen
Bevordert het reproduceren van onderzoekDe impact van datasets en dataproducenten kan gemeten worden

Persistent identifiers

Om citatie van datasets mogelijk te maken moeten ze over een persistent identifier beschikken. Een persistent identifier is een uniek label dat gekoppeld is aan een digitaal object. Hierdoor kan het object altijd gevonden worden, ook bij veranderingen van naam en plaats. Zo voorkom je het ontstaan van gebroken links of een page not found. Dankzij een persistent identifier is een object altijd en overal eenduidig refereerbaar (citeerbaar) en vindbaar.

Er zijn verschillende persistent identifier systemen, bijv. URN, PURL, ARK en DOI. Afhankelijk van het doel kunnen aan een object verschillende persistent identifiers toegekend worden.


Photo by Paul Vierkant CC-BY

De DOI

In dit kader herhalen we wat er in de video over datacitatie aan bod kwam.

Een DOI (Digital Object Identifier) is bij uitstek geschikt om een digitaal object citeerbaar te maken en wordt alleen toegekend aan objecten die voor de lange termijn beheerd en toegankelijk blijven.  DOI's worden al veel gebruikt in de wetenschappelijke literatuur om naar tijdschriftartikelen te linken. Door een DOI toe te kennen aan een dataset, maak je de herkomst herleidbaar en citeerbaar.

DOI's worden steeds meer geaccepteerd als de persistent identifier naar keuze als het op datacitatie aankomt. Dat merk je onder andere doordat systemen die andere persistent identifiers aanbieden daarnaast ook DOI's gaan aanbieden. Dataverse Network bood eerst alleen Handle en gaat nu over(8) op DOI's. Ook DANS biedt naast URN's DOI's aan.

Structuur van een DOI 

De DOI bestaat uit twee delen:

  • een prefix (voorvoegsel) bestaande uit het getal '10' gevolgd door 4 of meer cijfers;
  • en een suffix (achtervoegsel);
  • die gescheiden zijn door een schuine streep.

De identificatiecode in het voorvoegsel staat voor diegene die de dataset geregistreerd heeft. Na de schuine streep volgt de identifier voor de dataset.

Voorbeeld van een DOI: 10.4121/uuid:c1ac7344-1419-4398-ba13-c757551c303f.

Registratie

DOI’s worden geregistreerd via DataCite en in Nederland via DataCite Netherlands.(9) Een onderzoeker krijgt een DOI voor zijn dataset zodra hij zijn dataset deponeert in data-archief die klant is bij DataCite. Dan registreert de instelling de DOI voor de dataset die door de instelling zelf gearchiveerd wordt. Je kunt als individuele onderzoeker geen DOI registreren. Dit is algemeen beleid van DataCite.

Wanneer een DOI wordt geregistreerd is het verplicht om een minimale set metadata aan te leveren. Alle verplichte, optionele en aanbevolen metadata staan beschreven in het DataCite Metadata Scheme.(10) Alle toegekende metadata worden opgeslagen in de zogeheten DataCite Metadata Store(11) en zijn daarmee afzoekbaar.

Citatie

DataCite adviseert(12) hoe je een dataset moet citeren als je deze in een publicatie vermeldt. De aanbevolen citatiestijl is:

Creator (PublicationYear): Title. Publisher. Identifier

Dat ziet er dan bijvoorbeeld voor deze dataset(13) in 4TU.Centre for Research Data zo uit: 

   Bronnen en verder lezen

Klik om te openen/sluiten

Bronnen

  1. ANDS. Data citation awareness. Retrieved from http://ands.org.au/guides/data-citation-awareness.html
  2. ORCID. (2013, June 17). Connecting research datasets and researchers: ORCID use cases and integrations. [blog]. Retrieved from orcid.org/blog/2013/06/17/connecting-research-datasets-and-researchers
  3. ORCID-ID. Retrieved from orcid.org
  4. Altmetrics: a manifesto. (2010). Retrieved from altmetrics.org/manifesto/
  5. FORCE 11. Retrieved from http://www.force11.org/about
  6. FORCE 11. (2013). Data citation principles. Retrieved from https://www.force11.org/about/manifesto
  7. DataCite Task Force. (2013). DataCite Implementation Recommendations. A report of the DataCite Task Force. Retrieved from https://deepblue.lib.umich.edu/bitstream/handle/2027.42/100249/DataCiteTaskForceReport.pdf?sequence=1
  8. The Dataverse Network Project. (2013). DOIs - coming to a dataverse near you. Retrieved from thedata.org/blog/dois-coming-dataverse-near-you
  9. DataCite Netherlands. Retrieved from http://datacite.tudelft.nl/info/home/
  10. Datacite. Datacite metadata schema v 3.0. Retrieved from http://schema.datacite.org/meta/kernel-3/index.html
  11. Datacite. Datacite metadata store. Retrieved from https://mds.datacite.org/
  12. Datacite. Why cite data? Retrieved from https://www.datacite.org/cite-your-data.html
  13. Keen, A.S. (2011). Erosive Bar Migration Using Density and Diameter Scaled Sediment Erosive Profile Set-Prototype Scale (Actual Scal 1:10). TU Delft. http://dx.doi.org/10.4121/uuid:32c53005-a4f2-447c-b231-6cdb7dcdd17f

Verder lezen

 

 


Like · Dislike 1 ·  
Not rated yet. Be the first who rates this item!

Frans de Liagre Böhl - There are also other PI´s available, e.g. EPIC, which is the result of a European initiative and which is currently in use at EUDat. What exactly are the differences and what would be the reason to prefer one over the other. My impression so far is that EPIC is based on a Restfull infrastructure and thus seems more robust, as the identifier can be handed out, even if the registry agency is off-line for some reason. But is that the main difference?

1 year 1 week ago · 
Not rated yet. Be the first who rates this item!
I like maybeLike · 

Research Data Netherlands - @Frans: (in Dutch) de NCDD http://www.ncdd.nl/news/persistent-identifiers-hoe-en-2-minuten/ biedt informatie en een beslisboom met veel toelichting. De verschillen tussen de PID_smaken zijn deels gewoon historisch gegroeid (met hun gebruikersgroepen) en niet per se principieel.

1 year 1 week ago · 
Not rated yet. Be the first who rates this item!
I like maybeLike · 

Jerry Vries - Ik mis het handle systeem hier in het persistent identifier overzicht.

9 months 3 days ago · 
Not rated yet. Be the first who rates this item!
I like maybeLike · 

Research Data Netherlands - @Jerry: inderdaad, die moeten we toevoegen wanneer we de site weer inhoudelijk actualiseren. In de tussentijd verwijzen we geïnteresseerden graag naar de toelichting die de NCDD biedt: http://www.ncdd.nl/news/persistent-identifiers-hoe-en-2-minuten/

9 months 3 days ago · 
Not rated yet. Be the first who rates this item!
I like maybeLike ·