Print Pages

Access Page via Rule

Track Page Visit

Visited Pages JQuery

Navigatie Hoofdstuk III Hoofdstuk I Hoofdstuk II Hoofdstuk III Hoofstuk IV Hoofdstuk V Hoofdstuk VI
Navigatie HIII tablet I II III IV V VI
Navigatie Hoofdstuk III mobiel I II III IV V VI

Data verzamelen

"If you don’t think you have a quality problem with your data, you haven’t looked at it yet." -  Jeni Tennison(1)



Data verzamelen

    Data verzamelen

Hoe verzamelt een onderzoeker zijn data? Dat doet hij op één van de twee volgende manieren(2)

  • Hij gebruikt bestaande data.


    Bestaande data (ook wel 'secundaire data') zijn:
    • data die door anderen zijn verzameld zoals data verzameld door grote instellingen zoals het CBS, het Kadaster, ministeries enzovoort. Centerdata(3) is bijvoorbeeld een instituut dat (panel)data verzamelt, analyseert en ter beschikking stelt voor wetenschappelijk onderzoek.
    • onderzoeksdata die door andere onderzoekers voor hergebruik in data-archieven zijn gedeponeerd.
  • Hij verzamelt zijn onderzoeksdata zelf.

    Gecreëerde data (ook wel 'primaire data') zijn de primaire resultaten van allerlei soorten onderzoeken. Deze data worden door een onderzoeker zelf geproduceerd. Er bestaat een onderscheid tussen ruwe data en bewerkte data, maar die scheidslijn is in de praktijk vaag. Meetapparaten worden steeds geavanceerder en een deel van de bewerking van de data kan al gedaan zijn in het apparaat voordat de data uit het apparaat rollen. Daarmee is de ruwe data in feite al bewerkt.

Er zijn grofweg vijf verschillende manieren om onderzoeksdata te creëren:

  • Door observatie.
    Dit type data kan in de regel maar één keer verzameld worden en is daardoor uniek te noemen. Denk hierbij aan klimaatgegevens, astronomische observaties, archeologische opgravingen, opiniepeilingen, surveyonderzoek.

  • Met experimenten.
    Data verzameld met experimenten (met behulp van lab apparatuur). Denk aan de synthese van nieuwe moleculen, de analyse van gen sequenties en psychologische tests. Deze experimenten kunnen in de regel herhaald worden.

  • Door simulatie (test modellen).
    Denk hierbij aan klimaatmodellen en economische modellen. De resultaten van simulaties zijn meestal eenvoudig te reproduceren. Het model en de metadata zelf zijn dan belangrijker om te bewaren dan de data die de simulaties opleveren.

  • Door data processing.
    Combinatie, herbewerking, (her)groepering etc. van eerder gecreëerde data.

  • Door bronnenonderzoek.
    Denk hierbij aan data die voortkomen uit archief- en literatuuronderzoek en gericht zijn op het samenstellen van teksten of series van ‘meetbare’ gegevens uit archiefstukken, manuscripten en (vak)publicaties. Het kan ook gaan om specialistische query's op grote taalkundige of linguïstische databases.

Een onderzoeker die zelf zijn onderzoeksdata verzamelt, moet rekening houden met een scala aan factoren. Is het meetinstrument wel goed gekalibreerd, bijvoorbeeld? Meet hij wel wat hij denkt te meten? Zijn de surveyvragen niet te sturend? Dit soort vragen zijn van grote invloed op datakwaliteit, maar maken geen onderdeel uit van deze cursus.

   Bronnen

Klik om te openen/sluiten

  1. Tennison, J. (2013, December 3). Five stages of data grief. [blog]. Retrieved from http://theodi.org/blog/five-stages-of-data-grief
  2. Scott, M., e.a. (2013). Introducing Research Data. University of Southampton. Retrieved from http://eprints.soton.ac.uk/360442/1/researchdataintro.pdf
  3. Centerdata.  Over Centerdata. Retrieved from http://www.centerdata.nl/nl/over-ons

Like · Dislike ·  
Not rated yet. Be the first who rates this item!
I like maybeLike · 

No comments

RDNL maakt gebruik van cookies. Meer informatie Sluiten