Data verzamelen

The first way of thinking about research data is where it comes from | University of Southampton, 2016 

Hoe komen onderzoekers aan hun onderzoeksdata? In deze paragraaf passeert kort een aantal manieren de revue.  

Data verzamelen

Hoe verzamelt een onderzoeker zijn/haar  data? Dat doet hij/zij op één van de twee volgende manieren (University of Southampton, 2016): 

  1. De onderzoeker gebruikt bestaande data

    Bestaande data zijn:

    • Data die door anderen zijn verzameld zoals data verzameld door grote instellingen zoals het CBS, het Kadaster, ministeries enzovoort. CentERdata (n.d.) is bijvoorbeeld een instituut dat (panel)data verzamelt, analyseert en ter beschikking stelt voor wetenschappelijk onderzoek.
    • Onderzoeksdata die door andere onderzoekers voor hergebruik in data-archieven zijn gedeponeerd. Zie de paragraaf 'Zoeken naar data' voor het vinden van herbruikbare datasets. 
  2. De onderzoeker genereert de onderzoeksdata zelf

    Bij het genereren van onderzoeksdata bestaat er een onderscheid tussen ruwe data en bewerkte data, maar die scheidslijn is in de praktijk vaag. Meetapparaten worden steeds geavanceerder en een deel van de bewerking van de data kan al gedaan zijn in het apparaat voordat de data uit het apparaat rollen. Daarmee is de ruwe data in feite al bewerkt.

Vijf manieren 

Er zijn grofweg vijf verschillende manieren om onderzoeksdata te creëren (University of Southampton, 2016):

  • Door observatie
    Dit type data kan in de regel maar één keer verzameld worden en is daardoor uniek te noemen. Denk hierbij aan klimaatgegevens, astronomische observaties, archeologische opgravingen, opiniepeilingen, surveyonderzoek.
     
  • Met experimenten
    Data verzameld met experimenten (met behulp van labapparatuur). Denk aan de synthese van nieuwe moleculen, de analyse van gensequenties en psychologische tests. Deze experimenten kunnen in de regel herhaald worden.
     
  • Door simulatie (testmodellen)
    Denk hierbij aan klimaatmodellen en economische modellen. De resultaten van simulaties zijn meestal eenvoudig te reproduceren. Het model en de metadata zelf zijn dan belangrijker om te bewaren dan de data die de simulaties opleveren.
     
  • Door data processing
    Combinatie, herbewerking, (her)groepering etc. van eerder gecreëerde data.
     
  • Door bronnenonderzoek
    Denk hierbij aan data die voortkomen uit archief- en literatuuronderzoek en gericht zijn op het samenstellen van teksten of series van ‘meetbare’ gegevens uit archiefstukken, manuscripten en (vak)publicaties. Het kan ook gaan om specialistische queries op grote taalkundige of linguïstische databases.
     

Een onderzoeker die zelf zijn/haar onderzoeksdata verzamelt, moet rekening houden met een scala aan factoren. Is het meetinstrument wel goed gekalibreerd, bijvoorbeeld? Meet hij/zij wel wat hij denkt te meten? Zijn de surveyvragen niet te sturend? Zulke vragen zijn van grote invloed op datakwaliteit, maar maken geen onderdeel uit van deze cursus.

In de spotlight

 

De University of Melbourne University Library heeft een aantal video's gemaakt over datamanagement, waaronder deze over het verzamelen van data (University of Melbourne University Library, 2017). Welke van de vijf verschillende manieren om onderzoeksdata te creëren herken je? 




Bronnen 

Klik om te openen/sluiten

CentERdata (n.d.). Over CentERdata. http://www.centerdata.nl/nl/over-ons

University of Melbourne University Library (2017). Collecting research data [video]. https://vimeo.com/200625882

University of Southampton (2016). Introducing Research Data. 4th Edition. https://eprints.soton.ac.uk/403440/1/introducing_research_data.pdf