Organiseren van onderzoeksdata

"Not one system is going to put structure in your data, because it doesn't understand your research. The structure comes from you." - Patrick Vandewalle

    Hoofdlijnen

Als je wilt dat onderzoeksdata vindbaar en makkelijk te interpreteren zijn en blijven, dan is het zaak de data op een gestructureerde, consequente manier op te slaan en te voorzien van de benodigde data documentatie (metadata). De folderstructuur waarin de data terecht komen, moet voor zich spreken, net zoals de bestandsnamen die voor de data files worden gebruikt (zie kader). 

Het kan ook zo zijn dat een onderzoeker gebruik maakt van een systeem dat al een bepaalde mate van structuur in zich heeft. Er is bijvoorbeeld al een indeling in folders. En als je data uploadt wordt er om basis metadata gevraagd zoals auteur, datum, enzovoort. Denk hierbij aan een datalab zoals Dataverse network(1) of een datalab gemaakt in Sharepoint.

File naming en versiebeheer
File naming en versiebeheer

Betekenisvolle bestandsnamen

Hieronder volgt een aantal tips om bestandsnamen betekenisvol en consistent op te slaan. Lees hierover ook 'Naming files and folders'.(2)

  • Zorg ervoor dat bestandsnamen consistent benoemd worden. Gebruik je bijvoorbeeld de datum in de bestandsnaam, kies dan hoe je de datum noteert (bijvoorbeeld YYYYMMDD of yymmdd).
  • Plaats geen rare karakters zoals ?\!@*%{[<> in de bestandsnaam.
  • Geef herleidbare bestandsnamen, zoals Project_Instrument_locatie_YYYYMMDD.ext.
  • Zorg ervoor dat elk bestand maar één keer in de folderstructuur voorkomt. Als je een bestand op meerdere plekken opslaat en je gaat één van beiden bewerken, dan kunnen er ongewild meerdere versies van hetzelfde bestand ontstaan. 
  • Zie ook versiebeheer.

Het is good practice om de keuze voor file naming en de betekenis daarvan te noteren in een readme.txt.

Ook als een onderzoeker al een eind op weg is in zijn project, kan hij overgaan op een consistente naamgeving voor bestandsnamen. Hij zou dan eventueel gebruik kunnen maken van een zogeheten bulk file rename utility.(3) Het is wel zaak te checken of zo'n bulk renamer levert wat deze belooft. 

  Casus

Hieronder zie je de voorgestelde folderstructuur en bestandsnamen voor het onderzoek van Beatriz Ramirez afkomstig uit het datamanagementplan(4) dat zij maakte voor haar onderzoek aan Wageningen Universiteit.

  Bronnen

Klik om te openen/sluiten
  1. Dataverse Network. Retrieved from http://thedata.org
  2. University of Leicester. Naming files and folders. Retrieved from http://www2.le.ac.uk/services/research-data/organise-data/naming-files
  3. Bulk Rename Utility for Windows. Retrieved from http://www.bulkrenameutility.co.uk/Main_Intro.php
  4. Ramirez, B. (2013). Data management plan. Retrieved from  http://www.wageningenur.nl/en/Expertise-Services/Data-Management-Support-Hub/Browse-by-Subject/Organising-files-and-folders.htm (example DMP 2)

Verder lezen


botMessage_toctoc_comments_9210