Print Pages

Access Page via Rule

Track Page Visit

Visited Pages JQuery

Navigatie EN HIV H I H II H III H IV H V H VI
Navigatie EN tablet HIV H I H II H III H IV H V H VI
Navigatie EN mob H4 H I H II H III H IV H V H VI

Metadata in data archives


Metadata scheme

   Main points

When a data set is included in a data archive (ingest) it is inspected to verify whether the data set has been defined adequately. The key question is: does a (future) user have sufficient information to understand what the data set implies?

Both the creator and the data manager can assign so-called metadata. By assigning metadata it becomes easier to find, recognise, (re)use or link a source of information to other sources of information. 
(Also refer to the section Data documentation and metadata).

Various disciplines apply their own metadata schedules and standards (see box). Which metadata fields are mandatory or desirable may vary per file. Both DANS and 4TU.Centre for Research Data use Dublin Core Metadata Initiative (DCMI)(1) as the standard for metadata. Dublin Core is easy to use and it is used worldwide. As a result, it is easy to link metadata to other files and automatically search through them, which increases the familiarity of the data. The underlying data itself, however, cannot be searched.

The metadata in 4TU.Centre for Research Data are available in so-called RDF-format. RDF is a general standard that allows you to easily connect data deriving from several sources. RDF makes it possible to use existing metadata schedules like Dublin Core and combine these with other metadata schedules. Dublin Core is a collection of the actual metadata fields and with RDF you can make the connections. 

If a researcher is planning to deposit his data in an archive, it is advisable to define the metadata fields at an early stage. This will prevent him from having to add the documentation or metadata afterwards.

About metadata schemes and metadata standards

A metadata scheme is a set of individual metadata elements that you can use to describe data. Most schemes are developed and subscribed to by certain communities. Each metadata element in a metadata scheme is assigned a name and a meaning. An example of a scheme developed by the community is the Data Documentation Initiative(2) (DDI), an international standard on describing data from socioscientific, behavioural and economic research.

If a standardisation institution such as ISO(3) approves a metadata scheme, it is called a metadata standard. An example of a metadata standard is the Dublin Core Metadata Element Set(4) also known as ISO 15836:2009.(5)

     An in-depth look

  • There are many kinds of metadata schedules and standards, depending on the research community, its objective, the function and the field. The following illustration(6) paints a good picture of the diversity mentioned. 

  • The English Digital Curation Centre (DCC) provides a good overview(7) of the schemes and the standards in some of the disciplines. 

  Case mandatory metadata fields

Mandatory metadata fields for DANS and 4TU.Centre for Research Data

DANS4TU.Centre for Research DataMeaning
CreatorCreator

The most important researchers involved in creating data

TitleTitleName of title of data set
Date createdDate created
DescriptionDescription
AudienceThe audience for whom the data is interesting, described in terms of research fields
Publication year

 

These are only the most important mandatory metadata fields. The more fields that are filled in, the easier it is to find the data set.

Another metadata element is the identifier. An identifier is generally a number or code linked to a data object. Preferably, the identifier must be unique and persistent so that the data set's findability is guaranteed for the long term.

Some examples of identifiers:

  • ISBN - International Standard Book Number.
  • DOI - Digital Object Identifier, used worldwide for publications such as journal articles (via CrossRef(8)) and in recent years also for data sets (via DataCite(9)).
  • URN - Uniform Resource Name, unique and persistent identifier.
  • URL - Uniform Resource Locator or web address (although persistence isn't always guaranteed).

Also see Persistent identifiers.

   Sources

Click to open/close

  1. Dublin Core Metadata Initiative. Retrieved from dublincore.org
  2. Data Documentation Initiative. Retrieved from http://www.ddialliance.org/
  3. ISO. Retrieved from www.iso.org/iso/home.html
  4. Dublin Core Metadata Initiative, Dublin Core Metadata Elementen Set, Version 1.1. Retrieved from dublincore.org/documents/dces/
  5. ISO. ISO 15836:2009, information and documentation - The Dublin Core metadata element set. Retrieved from http://www.iso.org/iso/catalogue_detail.htm?csnumber=52142
  6. Bargmeyer, B.; Gillman, D. (2000). Metadata standards and metadata registries: An overview. Retrieved from http://stats.bls.gov/ore/pdf/st000010.pdf
  7. DCC. Disciplinary metadata. Retrieved from www.dcc.ac.uk/resources/metadata-standards
  8. CrossRef. Retrieved from www.crossref.org
  9. Datacite. Retrieved from https://www.datacite.org/

Like · Dislike 1 ·  
Not rated yet. Be the first who rates this item!

Merle Rodenburg - Ik heb twee vragen over de metadata en de vindbaarheid van de Nederlandse data-archieven:
"Dublin Core is eenvoudig in het gebruik en wordt wereldwijd toegepast. Hierdoor zijn metadata makkelijk te linken met andere archieven en automatisch te doorzoeken, wat de bekendheid van de data vergroot." [..] "De metadata in 3TU.Datacentrum zijn in RDF-formaat beschikbaar. RDF is een algemene standaard die het mogelijk maakt om heel eenvoudig verbanden te leggen tussen data uit verschillende bronnen. "

Vraag 1) Wordt RDF enkel gebruikt door het 3TU.Datacentrum voor de metadata, en niet door DANS? Zo ja, wat is de reden hiervoor?
Vraag 2) Worden de archieven (DANS + 3TU.Datacentrum) geharvest of geïndexeerd om de vindbaarheid van de datasets te vergroten? Zo ja, waardoor?

2 years 11 months ago · 
Not rated yet. Be the first who rates this item!
I like maybeLike · 

Research Data Netherlands - Ad 2: de archieven van DANS en 3TU.Datacentrum bieden hun metadata aan conform het OAI-PMH-protocol (zie http://www.openarchives.org/OAI/openarchivesprotocol.html). Harvesters die ook volgens dit protocol werken, zoals de harvester van NARCIS.nl, kunnen dan de metadata "oogsten". Dit protocol eist dat er in elk geval metadata in Dublin Core formaat worden aangeboden.
Ad 1: niet zozeer een reden, maar vooral een kwestie van beschikbare tijd en capaciteit. In de context van Linked Open Data is DANS wel de mogelijkheden aan het verkennen om de metadata ook anders aan te bieden.

2 years 11 months ago · 
Not rated yet. Be the first who rates this item!
I like maybeLike · 

Frans de Liagre Böhl - Naast deze standaard structuren zijn er ook nog talloze, vaak vakspecifieke, semantische standaarden, zoals vocabulaires en thesaures en taxonomien. Het is goed dat er bijv. een element voor het aangeven van de onderzoeks discipline is, maar moet dat een vrij veld zijn, of gebonden aan een vaste lijst met waardes? Dit heeft invloed op de mogelijkheid van datadiscovery in een archief. Voorbeeld, je zoekt op 'history' in het veld 'discipline', maar het achterliggende vocabulaire kent alleen 'humanoria'.

1 year 2 weeks ago · 
Not rated yet. Be the first who rates this item!
I like maybeLike · 

Harry Garst - De visualisatie gaf een duizelingwekkende hoeveelheid afkortingen. Gelukkig stond er ook een bij die RELAX blijkt te heten.

1 year 4 days ago · 
Not rated yet. Be the first who rates this item!
I like maybeLike · 

Hilde van Zeeland - Dit is een mooi voorbeeld van een initiatief dat standaarden in vocabulaires bij elkaar brengt (voor het domein voedsel en agricultuur): http://vest.agrisemantics.org/

8 months 1 week ago · 
Not rated yet. Be the first who rates this item!
I like maybeLike ·