Print Pages

Access Page via Rule

Track Page Visit

Visited Pages JQuery

Navigatie Hoofstuk IV Hoofdstuk I Hoofdstuk II Hoofdstuk III Hoofdstuk IV Hoofdstuk V Hoofdstuk VI
Navigatie HIV tablet I II III IV V VI
Navigatie Hoofdstuk IV mobiel I II III IV V VI

Data processing

   Hoofdlijnen

Data processing is een overkoepelende term voor de transformaties die onderzoeksdata kunnen ondergaan gedurende verschillende levensfasen. In deze paragraaf bekijken we de transformaties vanaf het moment dat onderzoeksdata aan een data archief worden aangeboden. Het Reference Model for an Open Archival Information System OAIS(1) kent drie levensfasen voor datasets die aangeboden worden aan een data-archief: 

Data processing in progress
  • Submission Information Package (SIP).
  • Archival Information Package (AIP).
  • Dissemination Information Package (DIP).

Voor, tussen en ná deze drie fasen kunnen datasets transformaties ondergaan. Denk daarbij bijvoorbeeld aan:

  • Conversie van één dataformaat naar een ander (bijvoorbeeld duurzaam) dataformaat.
  • Reorganiseren van folders en files.
  • Toevoegen van (extra) metadata en een persistent identifier.
  • Inpakken en comprimeren van een dataset zodat deze minder opslagruimte in beslag neemt.
  • Data interactie waarbij je bijvoorbeeld een deel van een dataset downloadt op basis van een query.
  • ...

    Casus van SIP tot DIP

Fase 1

  • Deponeren

Hieronder zie je een filmpje van het deponeren van een archeologische dataset in EASY, het online archiveringssysteem van DANS. 70% van de archeologische datasets in EASY is open access beschikbaar.(2) 


Zet op HD-kwaliteit voor de beste kijkervaring

Fase 2

  • Archiveren

In onderstaand plaatje zie je een voorbeeld van data processing nádat de dataset is gedeponeerd en vóórdat deze aan gebruikers wordt aangeboden. Aan de linkerkant zie je de files zoals een data depositor deze inleverde bij EASY. Aan de rechterkant zie je hoe een datamanager van DANS de files herordent voordat hij deze aan gebruikers van EASY ter beschikking stelt:

  • De foto's staan niet meer los maar in een mapje 'Foto's'.
  • De Excel file is omgezet in .csv. Dit preferred format kan gemakkelijk als tekst en als tabel worden geopend.


Fase 3

  • Presentatie en terbeschikkingstelling

Je kunt bovenstaande dataset hier vinden. 

  De diepte in

  • Klik op het icoontje van DANS of 4TU.Centre for Research Data hieronder als je meer wilt weten over data processing bij (één van) deze twee data-archieven.
Keuze DANS 3TU Data Processing 3TU data processing DANS data processing
  • Lees een artikel(3) waarin de data deposit practices en ingest praktijken van zestien data archieven worden vergeleken.

   Bronnen

Klik om te openen/sluiten

Bronnen

  1. CCSDS. (2012). Reference Model for an Open Archival Information System (OAIS). Retrieved from http://public.ccsds.org/publications/archive/650x0m2.pdf
  2. DANS. 70% archeologische data in EASY openbaar toegankelijk. Retrieved from http://dans.knaw.nl/nl/actueel/nieuws/70-archeologische-data-easy-openbaar-toegankelijk
  3. Young, A.; Tibbo, H. (2011, Winter). Examination of data deposit practices in repositories with the OAIS model. IASSIST Quarterly, 6-13. Retrieved from www.iassistdata.org/sites/default/files/iqvol35_tibbo.pdf

  Jouw toevoegingen

Ken jij voorbeelden waarin data transformaties ondergingen? Wat leverde dat op? Heb je andere opmerkingen?  Laat het weten in de comments.


Like · Dislike 1 ·  
Not rated yet. Be the first who rates this item!

peter verberne - Eind jaren 80 en begin jaren 90 was word-perfect zeer geliefd als tekstverwerker. Wetenschappers (rechtenstudies en filosofie) sloegen bijna alles op in dit formaat. Toen slechts een tiental jaren later gepoogd werd om deze gegevens weer leesbaar te maken in andere toepassingen zijn sommige documenten geheel verloren gegaan en andere slechts ten dele succesvol geconverteerd naar open formaten, zoals txt bestanden.

3 years 3 months ago · 
Not rated yet. Be the first who rates this item!
I like maybeLike · 

Rick Vermunt - Er kan er ook 1 bedenken: wat dacht je van Lotus Notes? Wie heeft er überhaupt ooit van gehoord? Ik was overigens verbaasd te zien dat Dbase zelfs nog bij acceptable formats wordt genoemd. Had ik niet verwacht.

3 years 3 months ago · 
Not rated yet. Be the first who rates this item!
I like maybeLike · 

Marjo Bakker - Aan de eerste dataset die ik overbracht naar DANS EASY bleken door DANS extra trefwoorden te zijn toegekend. Dat vond ik best ver gaan; het voelde alsof er toch inhoudelijke veranderingen aan de dataset waren gedaan (terwijl het 'maar' metadata waren).

2 years 9 months ago · 
Not rated yet. Be the first who rates this item!
I like maybeLike · 

Research Data Netherlands - @Marjo: Dat is nuttige feedback voor de datamanagers bij DANS. Die doen dit om de vindbaarheid van de data te vergroten. Ze nemen ook vaak contact op met degene die data deponeert, als ze denken dat de data (nog) beter gepresenteerd kan worden.

2 years 9 months ago · 
Not rated yet. Be the first who rates this item!
I like maybeLike · 

Esther Eisen - Waarom wordt er gezegd dat de data in het voorbeeld 'Open Access' zijn terwijl je in moet loggen om ze te kunnen raadplegen?

2 years 6 months ago · 
Not rated yet. Be the first who rates this item!
I like maybeLike · 

Research Data Netherlands - @Esther: Ha, mooi dat je een recente ontwikkeling op zijn staart trapt. Tot voor kort moesten bezoekers ingelogd zijn om data uit DANS EASY te kunnen downloaden, zodat we managementinformatie (voor DANS en voor sommige grote deponeerders) konden vergaren. Recent heeft DANS een verdergaande vorm van Open Access in EASY ingevoerd, waarbij inloggen niet meer nodig is. Fijn voor de hergebruiker, maar minder informatief voor de deponeerder en voor DANS, ook omdat het downloadpakket geen gebruiksvoorwaarden meer bevat met de regels voor het netjes citeren van de data bij hergebruik.
Vanwege het contract dat elke deponeerder met DANS EASY afsluit kan DANS niet zomaar met terugwerkende kracht alle datasets onder dit nieuwe regime brengen.

2 years 6 months ago · 
Not rated yet. Be the first who rates this item!

Stef Neerken - Al jaren maak ik, met grote tevredenheid, gebruik van DANS EASY om bestanden te ontsluiten (Toezichtkaart Voortgezet Onderwijs). De laatste jaren worden deze SPSS bestanden door DANS omgezet in meer duurzame bestandstypen als POR en DTA. Door het volgen van deze cursus leer ik de voordelen hiervan.

1 year 8 months ago · 
Not rated yet. Be the first who rates this item!
I like maybeLike · 

Harry Garst - Is er een instituut dat er voor zorgt dat alle oude software bewaard wordt? En zo ja, hoe kunnen zij die software later gebruikmaken zonder te beschikken over licenties (die al jaren verlopen zijn en niet meer geheractiveerd kunnen worden). Zonder die software zijn veel data onbruikbaar (of beperkt bruikbaar).

10 months 3 hours ago · 
Not rated yet. Be the first who rates this item!
I like maybeLike · 

Research Data Netherlands - @Harry: voor duurzaam bruikbare software kun je kijken bij https://www.softwareheritage.org/ en in het rapport van Patrick Aerts https://dans.knaw.nl/nl/actueel/software-in-een-nieuw-daglicht-rapport-en-webinar

9 months 4 weeks ago · 
Not rated yet. Be the first who rates this item!
I like maybeLike · 

RDNL maakt gebruik van cookies. Meer informatie Sluiten