Les données de la recherche

Selon l’OCDE, les données scientifiques (ou données de la recherche, research data) sont « des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider des résultats de recherche. »

« Ce terme ne s’applique pas aux éléments suivants : carnets de laboratoire, analyses préliminaires et projets de documents scientifiques, programmes de travaux futurs, examens par les pairs, communications personnelles avec des collègues et objets matériels (par exemple, les échantillons de laboratoire, les souches bactériennes et les animaux de laboratoire tels que les souris). »

Les types de données

L’inventaire des données utilisées ou générées par un projet, une publication,… est un premier travail indispensable.

Les données scientifiques sont de différente nature selon leur mode de création, leur analyse et leur traitement : elles sont alors brutes, formatées, nettoyées, compilées,…

Elles peuvent aussi être de différents types : numériques, textuelles, audiovisuelles, codes sources, modèles,…

Elles sont stockées sur différents supports, papier ou numérique.

Pour en savoir plus :
INIST. Types de données de la recherche

Les formats de données

Choisir un format de fichier ouvert et non propriétaire, quand c’est possible, vise à permettre l’accès au plus grand nombre en évitant les limites dues à l’achat d’un logiciel, à la disparition d’un format,…

Pour en savoir plus :

L’organisation des données

Nommer et organiser ses fichiers, leurs versions successives et ses répertoires de données de façon rigoureuse et normalisée garantit l’identification, la protection et l’accès à ces données, pour ses propriétaires et pour les autres, dès maintenant et dans le temps.

Pour en savoir plus :

Des données FAIR

 

La notion de FAIR data (ou données FAIR) recouvre les manières de construire, stocker, présenter ou publier des données de manière à ce qu’elles soient Findable, Accessible, Interoperable et Reusable, soit en français : Faciles à trouver, Accessibles, Intéropérables et Réutilisables.

Le mot Fair fait référence au Fair use, fair trade, fair play, etc. : il évoque un comportement proactif et altruiste du producteur de données, prôné par de nombreux financeurs. Par exemple, l’Europe propose des modèles de  Plan de Gestion de données construit autour de ces 4 objectifs. 

Pour en savoir plus :