Zoeken naar data

Directories of research data repositories, such as re3data.org and FAIRsharing, web search engines, and colleagues can be consulted to discover domain-specific portals in your discipline. Repository developers invest significant time and energy organizing data in ways to make them more discoverable; use their work to your advantage. Familiarize yourself with the controlled vocabularies, subject categories, and search fields used in particular repositories | Gregory, 2018

Stel, je wilt onderzoeksdata van andere onderzoeken hergebruiken maar je weet niet waar je dat soort data zou kunnen vinden. Waar begin je dan? In deze paragraaf krijg je een aantal tips om data te vinden en te beoordelen op waarde. 

Manieren om data(archieven) te zoeken 

De eerste stap bij het zoeken naar onderzoeksdata voor hergebruik is dat je je een heel goed beeld vormt van de data die voldoen aan jouw onderzoeksdoelen. Als het beeld duidelijk is, kun je de volgende manieren om data(archieven) te zoeken uitproberen. 

1. Gebruik een catalogus van data-archieven

Via een catalogus of directory zoals Re3data.org (n.d.) of FAIRsharing (n.d.) kun je zoeken naar data-archieven (en dus nog niet naar de data zelf). In Re3data.org kun je zoeken op Subject, Content type en Country. Daarnaast kun je selecteren of je wilt zoeken naar data-archieven met een keurmerk, met datasets die open access ter beschikking worden gesteld en/of met datasets die een persistent identifier hebben. Het zoeken naar de datasets zelf doe je vervolgens in het data-archief naar keuze. Elk data-archief heeft weer zijn eigen zoekmogelijkheden.

2. Gebruik een zoekmachine

Je kunt Google (n.d.) gebruiken om data-archieven te ontdekken die het type onderzoeksdata bevatten waar je naar op zoek bent. Naast trefwoorden die het onderzoeksonderwerp beschrijven, is het belangrijk om ook trefwoorden zoals 'data archive' of 'datasets' aan de zoekopdracht toe te voegen. Het voordeel van deze aanpak is dat je zeker verder kijkt dan de 'usual suspects'. Google indexeert triljoenen webpagina's. Het nadeel kan zijn dat het tijd kost om de resultaten te filteren.

3. Gebruik een metadata-aggregator

De volgende zoekinstrumenten zijn voorbeelden van instrumenten waarmee je in de metadata van een selectie van data archieven zoekt. Je zoekt in de omschrijving van de data en niet in de data zelf.  

  • Google Dataset Search
    Google Dataset Search (n.d.) localiseert datasets. Het nadeel is het dat het niet erg inzichtelijk is in welke data-archieven Google Dataset Search allemaal zoekt. Als je geen geschikte data vindt, wil dat dus niet zeggen dat ze er niet zijn. Ze zijn dan in ieder geval niet via Google Dataset Search geïndexeerd.    
  • DataCite Search
    Met DataCite Search (DataCite, n.d.) zoek je in datasets waar een DOI (Digital Object Identifier) aan is toegekend.  
  • DataSearch 
    Met DataSearch (Elsevier, n.d.a.) kun je zoeken naar bepaalde typen data, zoals text, beeld, audio, slides, software, etc. Je zoekt via deze tool ook naar supplementary data geassocieerd met artikelen uit arXiv en ScienceDirect. De lijst met geindexeerde data-archieven staat onder de FAQ (Elsevier. n.d.b.)  
  • Data Citation Index
    De Data Citation Index is een betaalde dienst van Clarivate Analytics (n.d.).  
  • NARCIS
    Met NARCIS (DANS, n.d.)  zoek je - via de metadata - naar datasets die beschikbaar zijn bij Nederlandse data-archieven en repositories.
  • B2FIND
    B2FIND (EUDAT, n.d.) is een datasetontdekservice die zoekt in de metadata van onderzoeksdatacollecties van EUDAT-datacenters en andere repositories.
  • CESSDA Data Catalogue
    Via de CESSDA Data Catalogue (CESSDA, n.d.) zoek je naar datasets uit de sociale wetenschappen, afkomstig van de aangesloten CESSDA data-archieven. 
  • Survey Data Netherlands
    In Survey Data Netherlands (n.d.) kun je zoeken naar Nederlandse survey data.

Het zoeken in een data-archief

Als je hebt een data-archief hebt gevonden waar je jouw type data in verwacht, kun je de vervolgstap zetten: het zoeken in het data-archief. In een data-archief zoek je meestal in de metadata die aan de datasets zijn toegekend en niet in de daadwerkelijke inhoud van de datasets zelf. Houd daar bij het formuleren van je zoektermen dus rekening mee. Als je een aantal datasets bestudeert, dan leer je vanzelf welke metadatavelden het archief toekent en waar jij dus in kunt zoeken. Bekijk ook de 'Advanced Search' opties om de zoekmogelijkheden ten volle te benutten.

Hoe bruikbaar is de dataset?

Het vinden van een ogenschijnlijk geschikte dataset is de eerste stap. Het beoordelen van de bruikbaarheid van de gevonden dataset voor de beoogde onderzoeksdoeleinden is een belangrijke tweede stap. In de video hieronder staat een aantal behulpzame criteria (Utrecht University, 2018).

In de spotlight


Hoofdstuk in CESSDA Data Management Expert Guide over zoeken naar social science data

Bekijk het hoofdstuk in de CESSDA Data Management Expert Guide over het zoeken naar social science data (CESSDA, 2018). 

Cursus van VOGIN voor het zoeken naar data en andere informatie

Ben je geïnteresseerd in het zoeken naar data en andersoortige informatie? Tijdens de cursus Professioneel zoeken naar informatie (VOGIN. n.d.) gaat de VOGIN daar uitgebreid op in.

Lees het artikel 'Eleven quick tips for finding research data'

Meer weten? Lees het artikel 'Eleven quick tips for finding research data' (Gregory, et. al., 2018). 


Bronnen 

Klik om te openen/sluiten

CESSDA (n.d.) CESSDA DC Data Catalogue. Chapter 7. Discover. https://www.cessda.eu/Training/Training-Resources/Library/Data-Management-Expert-Guide/7.-Discoverhttps://datacatalogue.cessda.eu/ 

CESSDA (2018). Data Management Expert Guide.  

Clarivate Analytics (n.d.). The Data Citation Index. http://wokinfo.com/products_tools/multidisciplinary/dci/

DANS (n.d.). NARCIS. https://www.narcis.nl/search/coll/dataset/Language/en

DataCite (n.d.). DataCite. Find, Access and Reuse Data. https://search.datacite.org/

Elsevier (n.d.a.). DataSearch Beta. https://datasearch.elsevier.com/#/

Elsevier (n.d.b.). FAQ. https://datasearch.elsevier.com/faq#/

EUDAT (n.d.). B2FIND. https://eudat.eu/services/b2find

FAIRsharing.org. (n.d.). A curated, informative and educational resource on data and metadata standards, inter-related to databases and data policieshttps://fairsharing.org/

Google (n.d.). https://www.google.com

Google Dataset Search Beta. (n.d.) https://toolbox.google.com/datasetsearch

Gregory, K., Khalsa, S.J., Michener, W.K., Psomopoulos, F.E., de Waard, A., Wu, M. (2018). Eleven quick tips for finding research data. PLoS Comput Biol 14(4): e1006038. https://doi.org/10.1371/journal.pcbi.1006038

Re3data (n.d.).Registry of research data repositories. https://www.re3data.org/search?query=

Survey Data Netherlands (n.d.) https://www.surveydata.nl/browse-our-data

Utrecht University (2018, July 20). How useful is this dataset? Follow this short tutorial. [video]. https://youtu.be/t1SZutbCAxI  

VOGIN (n.d.). VOGIN-cursus Online opsporen van informatie (2 + 3 dagen). https://www.vogin.nl/academie/cursussen/