Documenter ses données, c’est donner les informations nécessaires pour les trouver, les lire, les comprendre et les réutiliser : sources, modalités de production, de collecte et de traitement, logiciel utilisé, format du fichier, unités de mesure, attribution de mots-clés thématiques descriptifs, localisation géographique, date d’acquisition, identifiant,…
Ces informations sont aussi appelées métadonnées, ce qui signifie « données décrivant des données ».
Les entrepôts de données proposent une liste de métadonnées pour décrire les jeux de données qu’ils hébergent, dont certaines sont obligatoires.
Vous pouvez en ajouter d’autres dans des fichiers joints à vos données : PGD, fichier décrivant les procédures et les méthodologies, liste des abréviations utilisées, des unités, etc…
Il existe des modèles de métadonnées standards pour certaines disciplines, qui favorisent l’interopérabilité et la réutilisation de vos données.
Des répertoires peuvent vous aider à les trouver :
- Digital Curation Center (DCC) : http://www.dcc.ac.uk/resources/metadata-standards
- Research Data Alliance (RDA) : http://rd-alliance.github.io/metadata-directory/standards/
- Fairsharing : https://fairsharing.org/standards/
- Thésaurus signalés par DMP Opidor : https://dmp.opidor.fr/static/about_registries#content
Le site Web du Digital Curation Center (DCC) et celui du Research Data Alliance (RDA) recensent également des outils logiciels pour générer ou stocker des métadonnées selon certains standards.
Tenir un Cahier de Laboratoire permet de documenter ses données au fur et à mesure de leur collecte et de leur traitement.
_A l’IRD, vous pouvez demander l’ouverture d’un cahier de laboratoire électronique collaboratif à cle@ird.fr_