RDM, open en FAIR

Good data management is a necessary precursor for FAIR and open, and enables data to be created which is fit for sharing and reuse  | Higman, 2019

Datamanagement (RDM), data stewardship, open data, open science en FAIR. Het zijn overlappende, maar verschillende concepten, die elk de nadruk leggen op verschillende aspecten van het beheren en delen van onderzoeksdata. In deze paragraaf lichten we het onderscheid nader toe en zoomen we in op manieren om hierover het gesprek met onderzoekers aan te gaan.   

Een verschil in definitie 

Open data, open science, FAIR data, data stewardship, RDM. Het zijn termen die jou -  als data supporter in spe - niet zullen zijn ontgaan. Maar ... wat betekenen ze en, belangrijker nog, hoe vind je tussen het datajargon door de juiste ingang om onderzoekers te ondersteunen? In de presentatie hieronder laten we allereerst een aantal definities zien voor de genoemde begrippen. Je zult zien dat open science, datamanagement en data stewardship een proces beschrijven: een manier waarop je de fasen van de onderzoekscyclus doorloopt. Open data en/of FAIR data kunnen de concrete en tastbare onderzoeksoutput zijn die uit deze processen voortkomt en waarop verder gebouwd kan worden.  

Van open naar 'shades of FAIR'

Het concept van open data (Open Knowledge Foundation, n.d.) volgde bijna automatisch uit het begrip open access (Openaccess.nl, n.d.), maar bracht ook weerstand met zich mee (Higman, 2019). Met name het misverstand dat alle data per se open access - in het publieke domein - beschikbaar zou moeten zijn. Het adagium 'open als het kan, gesloten als het moet' probeerde en probeert uit deze misverstandsimpasse een uitweg te bieden (European Commission, 2017). En ook het begrip FAIR biedt aanknopingspunten om het gesprek over open access tot onderzoeksdata minder zwart-wit te laten verlopen.

Data resulting from publicly funded research must be made FAIR and citable, and be as open as possible, as closed as necessary | European Commission, 2017 

De auteurs van de folder 'Hoe open is het' (SPARC & PLOS, 2014) lieten de 'Shades of open' voor open access tot wetenschappelijke publicaties zien. Op een vergelijkbare manier zijn onderzoeksdata onder te verdelen in 'Shades of Open' (LCRDM, 2019) en shades of FAIR (Mons, 2017). Er is geen one size fits all en dat besef alleen al biedt ruimte in het gesprek met onderzoekers. Zeker na de introductie van de Algemene Verordening Gegevensbescherming in 2018, wat onderzoekers bezorgder heeft gemaakt over de risico's van het delen van onderzoeksdata, is FAIR een goede gespreksstarter  (Higman, 2019).   

FAIR in vogelvlucht


Wat betekent FAIR?

Om het potentieel van onderzoeksdata volop te benutten, is het noodzakelijk om ze zo vindbaar (Findable), toegankelijk (Accessible), interoperabel (Interoperable) en herbruikbaar (Reusable) als mogelijk in het onderzoeksecocysteem op te nemen (Force 11, 2014; Wilkinson, et al., 2016; GoFAIR, n.d.). De FAIR principes bestaan uit 15 facetten (GoFAIR, n.d.). Wat voorop staat is dat onderzoeksdata niet alleen FAIR moeten zijn voor mensen, maar ook voor machines. De FAIR principes zijn niet meer weg te denken uit het datamanagement landschap en staan aan de basis van de bouwtekening van de European Open Science Cloud.

Is FAIR hetzelfde als open?

Nee.

In een artikel van Mons (2017) kun je daar de volgende toelichting bij lezen:  

De ‘A’ in FAIR staat voor ‘Accessible', toegankelijk onder goed gedefinieerde omstandigheden. Er kunnen legitieme redenen zijn om onderzoeksdata niet in open access ter beschikking te stellen zoals het beschermen van de privacy van onderzoeksdeelnemers. FAIR gaat over het vindbaar maken - door mens en machine - van onderzoeksdata door:

  • ze zo'n rijke context mee te geven dat het duidelijk is wat de waarde van de data is voor hergebruik;
  • expliciet - met een duidelijke, bij voorkeur machine-leesbare licentie - de voorwaarden aan te geven waaronder data mogen worden hergebruikt; 
  • duidelijke instructies te geven over het citeren bij hergebruik.

Geen van deze principes vereist dat onderzoeksdata 'open' of 'gratis' zijn. FAIR gaat over duidelijkheid en transparantie over de voorwaarden voor toegang en hergebruik. 

Data kunnen dus FAIR zijn en niet open.

Andersom kunnen data ook open zijn maar niet FAIR.

Wat is FAIR datamanagement?

FAIR datamanagement is het geheel van beslissingen en maatregelen die tijdens de levenscyclus van onderzoeksdata worden getroffen om onderzoeksdata zo FAIR als mogelijk af te leveren. Wat daarbij belangrijk is, is de keuze voor een datalicentie, voor het dataformaat, het vastleggen van metadata en data documentatie, naamgevingsconventies, etc. Allemaal aspecten die in de volgende hoofdstukken van Essentials 4 Data Support aan bod komen en die de FAIRnessvan onderzoeksdata beïnvloeden.

FAIR is een briljant acroniem en mede hierdoor is FAIR niet meer weg te denken uit het datamanagement landschap. Het zijn trouwens niet de enige dataprincipes die in omloop zijn. Zo bestaat er naast het FAIR acroniem ook het FACT acroniem - Fair, Accurate, Confidential, Transparent - zoals omschreven op de website van de Digital Society (n.d.)

Wat is de rol van data-archieven in het FAIR maken van data?

De rol van data-archieven in het FAIR maken van data is heel erg groot. In deze cursus richten we ons op onderzoekers en wat zij kunnen doen om data voor te bereiden op FAIRheid. Maar zonder een data-infrastructuur die gebouwd is op FAIR principes, kunnen onderzoekers niet erg veel. De aanbevelingen voor het FAIR maken van data richten zich vaak op beide doelgroepen: onderzoekers en data-archieven. Dat kan verwarrend zijn. 

In de Parthenos Guidelines to FAIRify data management and make data reusable (Parthenos, 2018) wordt een onderscheid gemaakt tussen de maatregelen per doelgroep. Zodat degene die de schoen past deze ook aan kan trekken.

Een van de aanbevelingen van de Europese Commissie (2017) om data FAIR te maken is om ze te publiceren in een betrouwbaar data-archief dat zich houdt aan de FAIR principes. Hoe zo'n data-archief dat dan precies voor elkaar krijgt, is niet iets wat een onderzoeker precies hoeft te weten.  


Hoe maak je data FAIR?

Digitale objecten (zoals onderzoeksdata, software, protocollen of andere onderzoeksgegevens) kunnen door onderzoekers worden voorbereid op een FAIRe toekomst. Maatregelen die zij kunnen nemen, staan hieronder globaal omschreven. In de rest van de cursus worden deze nader toegelicht.


Findable: Zorg dat data vindbaar zijn

Bereid data voor op FAIRheid (Tijdens het onderzoek) Publiceer data zo FAIR mogelijk (Na het onderzoek)
Documenteer de data.   
  • Ken Persistent Identifiers (PIDs) toe (bijvoorbeeld door publicatie in een data-archief).
  • Ken metadata toe die rijk genoeg is om de digitale objecten te kunnen vinden, citeren en (her)gebruiken.
  • Zet de PID in de metadata
 

Accessible: Zorg dat mens en machine bij de data kan komen

Bereid data voor op FAIRheid Publiceer data zo FAIR mogelijk
Bepaal de eventuele toegangsvoorwaarden.   Stel in ieder geval de metadata in open access ter beschikking, ook als dat niet kan voor de data zelf.  

Interoperable: Zorg dat computers de dataformaten en metadata herkennen en kunnen combineren

Bereid data voor op FAIRheid Publiceer data zo FAIR mogelijk
Sla data op in een gemeenschappelijk - en idealiter open - dataformaat. Documenteer de data rijkelijk met behulp van metadatastandaarden.

Reusable: Zorg ervoor dat de data geïnterpreteerd kan en mag worden

Bereid data voor op FAIRheid Publiceer data zo FAIR mogelijk
Documenteer de data. Sla ook de software code op die gebruikt is om de data te bewerken en analyseren.  Ken een machine-leesbare licentie toe die hergebruik mogelijk maakt.  

Oefenen

Wil je meer gevoel krijgen bij wat FAIR in de praktijk inhoudt? Doorloop de FAIR data assessment tool van Australian Research Data Commons (ARDC, n.d.).

In de spotlight

FAIR is 'here to stay'. Hieronder zie je een aantal bronnen waarmee je zelf meer kunt leren over 'FAIR in de praktijk' en mogelijke hulpmiddelen/voorbeelden waarmee je onderzoekers kunt bereiken. 


Bronnen en informatiemateriaal om FAIR te begrijpen

Gidsen:

Folders:

Zin in een sprookje? Lees dan 'A FAIRy tale' (Hansen, et al., 2018).

Voorbeelden van data support rondom FAIR Data

  • RDM Support van de Universiteit Utrecht heeft een gids geschreven met de titel 'How to make your data FAIR' (Utrecht University, n.d.). Enerzijds is dit een gids waarmee je zelf meer kunt leren over hoe je data FAIR maakt, maar het is ook een voorbeeld van hoe je data support rondom dit thema vorm zou kunnen geven. Door het maken en beschikbaar stellen van (digitaal) informatiemateriaal.
  • Medewerkers van Wageningen University & Research schrijven blogs over FAIR data en FAIR data stewardship (E.g. Wageningen University & Research, 2016 & 2019). 

Rapport: FAIR in de praktijk in de UK

Het rapport 'FAIR data in practice' (Allen & Hartland, 2018) biedt inzicht in de feitelijke situatie rondom FAIR datamanagement in de UK. De volgende bevindingen staan centraal (Bruce & Cordewener, 2019): 

  • Er is een gebrek aan kennis en begrip over wat FAIR betekent en wat het voordeel van FAIR-datamanagement zou kunnen zijn voor onderzoek; 
  • Dit gebrek aan kennis is ongelijk verdeeld over disciplines en belanghebbenden;
  • Er is verandering nodig en er moet geinvesteerd worden in het opleiden van onderzoekers;

Dit vereist coördinatie van activiteiten en beleidsontwikkeling op interdisciplinair, nationaal en internationaal niveau.

De FAIR dataprincipes worden door UK onderzoekers gezien als:

  • 'Verdergaand' dan open access;
  • Een nuttig concept bij het samenbrengen van verschillende aspecten van best practices voor datamanagement;  
  • Nuttig voor het ondersteunen van hergebruik van onderzoeksdata via verschillende typen datalicenties. 

Het rapport biedt ook een aantal aanbevelingen om bestaande tools en middelen het beste af te stemmen op FAIR. 


Bronnen 

Klik om te openen/sluiten

Allen, Robert, & Hartland, David. (2018, May 21). FAIR in practice - Jisc report on the Findable Accessible Interoperable and Reuseable Data Principles (Version 1). Zenodo. http://doi.org/10.5281/zenodo.1245568

Allen, R., Hartland, D. (2018, May 21). FAIR in practice - Jisc report on the Findable Accessible Interoperable and Reuseable Data Principles (Version 1). Zenodo. http://doi.org/10.5281/zenodo.1245568

ARDC (n.d.). Retrieved from https://www.ands-nectar-rds.org.au/fair-tool

Bruce. R., Cordewener, B. Open science is all very well but how do you make it FAIR in practice? [Blog]. https://blogs.lse.ac.uk/impactofsocialsciences/2018/07/26/open-science-is-all-very-well-but-how-do-you-make-it-fair-in-practice/ 

CESSDA (2018). Data Management Expert Guide. Benefits of data management. https://www.cessda.eu/Training/Training-Resources/Library/Data-Management-Expert-Guide/1.-Plan/Benefits-of-data-management

Digital Society (n.d.) Dataprincipes. https://www.thedigitalsociety.info/nl/over/dataprincipes/

Erdmann, C., Simons, N., Otsuji, R., Labou, S., Johnson, R., Castelao, G., ... Dennis, T. (2019). Top 10 FAIR Data & Software Things. Zenodo. http://doi.org/10.5281/zenodo.2555497

European Commission (2017). OSPP-REC. Open Science Policy Platform Recommendations. https://ec.europa.eu/research/openscience/pdf/integrated_advice_opspp_recommendations.pdf#view=fit&pagemode=none

European Commission (2019). Cost-benefit analysis for FAIR research data. Cost of not having FAIR research data - Study. https://publications.europa.eu/en/publication-detail/-/publication/d375368c-1a0a-11e9-8d04-01aa75ed71a1

F1000 (n.d). Your go-to guide to making your data Findable, Accessible, Interoperable, and Reusable (FAIR). https://f1000.com/resources/FAIR_Open_Guide.pdf

Force 11 (2014). The FAIR data principles. Retrieved from https://www.force11.org/group/fairgroup/fairprinciples

GO FAIR (n.d.) Fair principles. Retrieved from https://www.go-fair.org/fair-principles/

Hansen, K.K., Buss, M., Haahr, L.S. (2018). A FAIRy tale (p. 40). Zenodo. http://doi.org/10.5281/zenodo.2248200

Higman, R., Bangert, R., Jones. S. (2019). Three Camps, One Destination: The Intersections of Research Data Management, FAIR and Open.Insights 32 (1): 18. Retrieved from http://doi.org/10.1629/uksg.468

Imming, M. (2018). FAIR Data Advanced Use Cases: from principles to practice in the Netherlands. Zenodo. Retrieved from http://doi.org/10.5281/zenodo.126847

Jones, S., Grootveld, M. (2017, November). How FAIR are your data?. Zenodo. http://doi.org/10.5281/zenodo.3405141 

LCRDM (2019). Shades of Open. https://www.lcrdm.nl/files/lcrdm/2019-06/Shades%20of%20Open.pdf

Mons et al. (2017). Cloudy, increasingly FAIR; revisiting the FAIR Data guiding principles for the European Open Science Cloud. Information Services & Use, vol. 37, no. 1, pp. 49-56. https://doi.org/10.3233/ISU-170824​​​​​​

Openaccess.nl (n.d.). Wat is open access? https://www.openaccess.nl/nl/wat-is-open-access

Open Knowledge Foundation (n.d.) Open Data Handbook. What is open data? http://opendatahandbook.org/guide/en/what-is-open-data/

PARTHENOS, Hollander, H., Morselli, F., Uiterwaal, F., Admiraal, F.,  Trippel, T, Di Giorgio, S. (2018, December 1). PARTHENOS Guidelines to FAIRify data management and make data reusable. Zenodo. http://doi.org/10.5281/zenodo.2668479 

SPARC (Scholarly Publishing and Academic Resources Coalition), PLOS (Public Library of Science). (2014). How open is it? Open Access spectrum. [eprint]. Retrieved from https://www.plos.org/files/HowOpenIsIt_English.pdf

Utrecht University (n.d.). RDM Support. How to make your data FAIR [Guide]. ttps://www.uu.nl/en/research/research-data-management/guides/how-to-make-your-data-fair

Verheul, I., Imming, M., Ringersma, J., Mordant, A., Ploeg, J.L., Pronk, M. (2019, April 16). Datastewardship op de kaart: Een verkenning van taken en rollen in Nederlandse onderzoeksinstellingen. Zenodo. http://doi.org/10.5281/zenodo.2642066 (Zie ook https://www.lcrdm.nl/handreikingen-datastewardship voor meer LCRDM-informatie over data stewardship)

Wageningen University & Research (2016, 9 May). Can Wageningen be FAIR? [Open Science Blog]  https://weblog.wur.eu/openscience/can-wageningen-fair/ 

Wageningen University & Research (2019). Weblogs about FAIR data stewardship. https://weblog.wur.eu/openscience/data-stewardship-wur/

Wilkinson, M.D. et al. (2016). The FAIR Guiding Principles for scientific data management and stewardship, Scientific Data 3. Retrieved from https://dx.doi.org/10.1038/sdata.2016.18