Voorkeursformaten

Preferred formats zijn de bestandsformaten waarvan DANS het vertrouwen heeft dat deze op de langere termijn de beste garanties bieden qua bruikbaarheid, toegankelijkheid en duurzaamheid | DANS, n.d.

Of hergebruik van data mogelijk is, hangt af van het dataformaat en de aanwezige software om de data te kunnen lezen. Data-archieven hanteren vaak een lijst met voorkeursformaten waarin de data aangeleverd zouden moeten worden. Van data die in een voorkeursformaat worden aangeleverd, kunnen data-archieven garanderen dat deze langdurig bewaard kunnen worden en ook in de toekomst leesbaar en toegankelijk blijven. In deze paragraaf leer je daar meer over. 

Voorkeursformaten en acceptabele formaten 

Data-archieven hanteren bij opname meestal twee categorieën van onderzoeksdata: voorkeursformaten (preferred of recommended formats) en acceptabele formaten (non preferred formats of acceptable formats). 

Voorkeursformaten hebben grofweg de volgende kwaliteiten:  

  • Het bestandsformaat is in te lezen in vrij verkrijgbare software; 
  • Het dataformaat is goed gedocumenteerd en de documentatie is open beschikbaar;
  • Het bestandsformaat wordt veel gebruikt, in het algemeen of binnen een onderzoeksdiscipline.  

In de paragraaf 'Dataformaten' stonden we hier ook al bij stil.  


Verschillen tussen data-archieven

Verschillende dataformaten voor hetzelfde bestandstype hebben vaak unieke voor- en nadelen. Neem bijvoorbeeld dataformaten voor foto's:

  • JPEG is een universeel gebruikt formaat, gemakkelijk te openen door allerlei applicaties;
  • Met het Uncompressed TIFF-formaat behoud je de afbeelding zonder compressie, in de hoogste kwaliteit, maar wel in een omvangrijk formaat;
  • PNG is weliswaar een formaat met hoge kwaliteit en met een minder omvangrijk formaat dan Uncompressed TIFF, maar het formaat is niet in staat om bestandseigenschappen op te slaan zoals het type camera dat is gebruikt. Dit zit wel in JPEG en TIFF.

Verschillende data-archieven gaan anders om het aangeven van de voorkeursformaten voor foto's:

  • Bij bijvoorbeeld UK Data Service (n.d.) en het Australian Data Archive (n.d.) genieten TIFF 6.0 uncompressed files (.tif) de voorkeur of JPG (.jpg) als de foto's in dat formaat gemaakt zijn. PNG (.png) staat in het lijstje met acceptable formats;
  • Bij 4TU.Centre for Research Data (2017) en DANS (n.d.) staan JPEG, TIFF, PNG alle drie op de lijst met voorkeursformaten.

Waar veel organisaties de voorkeur geven aan de conversie van alle image-formaten naar uncompressed TIFF omdat dit in principe de maximale kwaliteit bevat, is het de stelling van DANS en 4TU.Centre for Research Data dat JPEG voldoende kwaliteit kan behouden en op de langere termijn een hogere robuustheid en ondersteuning geniet.

Er is nog geen systematiek om richtlijnen op elkaar af te stemmen en zo ontstaan verschillen. Verschil kan een gevolg zijn van nieuwe ontwikkelingen, waar de een eerder bij is dan de andere, van de waarde die een organisatie hecht aan bepaalde eigenschappen van het formaat en van de ervaring die een organisatie heeft met het toekomstbestendig bewaren van een bepaald dataformaat.

In de spotlight


Voorbeelden van lijsten met voorkeursformaten

Een aantal voorbeelden van lijsten met voorkeursformaten: 


Bronnen 

Klik om te openen/sluiten

4TU.Center for Research Data (2017). Preferred file formats. https://researchdata.4tu.nl/fileadmin/user_upload/Documenten/preffered_file_formats.pdf

Australian Data Archive (n.d.). Preferred forms for depositing data with ADA. https://legacy.ada.edu.au/ada/preferred-formats

DANS (n.d.). Bestandsformaten https://dans.knaw.nl/nl/over/diensten/easy/toelichting-data-deponeren/voor-het-deponeren/bestandsformaten

UK Data Service (n.d.). Recommended Formats. https://ukdataservice.ac.uk/manage-data/format/recommended-formats.aspx