Un data paper est une publication scientifique qui décrit précisément un jeu de données, et informe la communauté scientifique de son existence, de ses modalités et de son potentiel de réutilisation.
Sommaire
Le data paper est un article scientifique
Le data paper est publié, en libre accès, sous la forme d’un article examiné par les pairs dans une revue scientifique classique publiant différentes formes d’articles, dont des data papers, ou dans un data journal, c’est-à-dire une revue contenant exclusivement des data papers.
Des listes de revues publiant des data papers sont disponibles sur :
- la base « Où Publier » du CIRAD en sélectionnant une thématique, puis le critère Type d’article = Data paper
- la liste des « Revues publiant des Data papers » de L. Dedieu (CIRAD), mise à jour novembre 2017
- la compilation INRA (fichier excel)
- la liste indicative du Gbif
- la liste du projet Trac (UK)
La structure du data paper est particulière
Un data paper ne rend pas compte des hypothèses ni des conclusions issues de l’analyse de ces données, mais présente les analyses techniques et statistiques validant la qualité des données :
- Il décrit un jeu de données de recherche (dataset), notamment à l’aide d’informations précises, appelées métadonnées (metadata), qui détaillent pourquoi, par qui et comment ces données ont été collectées, qui en est propriétaire, sous quel format elles sont stockées, etc.
- Il démontre la qualité des données et de leur méthode de collecte et de traitement.
- Il montre l’originalité et la portée de ce jeu de données, ainsi que leur potentiel pour des utilisations futures (arguments décisifs pour l’acceptation de la publication).
- il donne généralement accès au jeu de données, dans un fichier attaché ou par un lien pérenne (URL, DOI) vers l’entrepôt (data repository, ou repository of research data) où le jeu est déposé. Le jeu de données décrit dans le data paper est en effet normalement accessible gratuitement à tous pour une réutilisation non-commerciale ou commerciale (licence CC0 ou Open data Commons Attribution Licence). Toutefois, selon les possibilités offertes par les entrepôts, les données peuvent être temporairement sous embargo, ou accessibles uniquement sur demande.
Des modèles et des guides de rédaction se trouvent sur :
Pourquoi publier un data paper ?
La publication d’un datapaper permet de :
- valoriser les données
- faciliter leur réutilisation
- leur apporter plus de visibilité
- les rendre plus facilement repérables et citables; le data paper étant une publication citable, au même titre que tout article scientifique, il met en valeur ses auteurs en tant que créateurs de données et permet la traçabilité des citations et des réutilisations.