Pour accéder aux données vous pouvez :

Suivre le lien « Supplementary data » à partir d’un article

A la fin des articles, un lien avec identifiant unique (DOI) vers les données ayant servi de base à l’écriture de l’article est de plus en plus souvent notifié.

Faire une veille sur les datapapers

Les datapapers indiquent la disponibilité de jeux de données et donnent leur lien vers l’entrepôt.

La plupart des data journals  proposent un flux RSS ou un système d’alertes par mail pour être averti des publications de data papers.

Interroger les moteurs de recherche spécialisés

Les moteurs de recherche de données permettent de rechercher dans plusieurs entrepôts dans le même temps :

  • le moteur de DataCite recherche dans tous les jeux de données ayant bénéficié de son service d’attribution de DOI, soit plus de 15 millions, dont celles de DtaSuds. Il propose de nombreux filtres des résultats (type de ressources, année, …)
  • Base, le moteur de recherche créé par la bibliothèque de l’Université allemande de Bielefeld, interroge 1700 serveurs de documents académiques et donne accès à plus de 8 millions de jeux de données en utilisant la recherche avancée et en ne cochant que le type de document « dataset »
  • DataSearch d’Elsevier (version bêta) explore plusieurs sources de données (cf. FAQ), auxquelles s’ajouteront prochainement les données incluses dans les articles.
  • Google Dataset Search (version bêta)

Sélectionner des entrepôts de données dans les annuaires

Les annuaires d’entrepôts répertorient des entrepôts certifiés, classés par thématiques ou typologie.

Il existe différents types d’annuaires :

  • Annuaire multidisciplinaire puissant et ergonomique : Re3data (Registry  of Research Data Repositories : plus de 2000 entrepôts)
  • Annuaires spécialisés : FAIRsharing (~1230 entrepôts en sciences de la vie et biomédecine), NIH Data Sharing Repositories (~80 entrepôts en Biomédecine sélectionnés par les National Institutes of Health américains), CAT Opidor (~50 entrepôts de données français)…
  • Annuaires mixtes (répertoriant entre autres des entrepôts de données) : OpenDOAR (Directory of Open Access Repositories : ~250 entrepôt sélectionnés via la recherche avancée, content type « dataset ») , OAD (Open Access Directory : ~120 entrepôts de données sélectionnés)…
  • Annuaire d ’entrepôts certifiés : CoreTrustSeal (Trustworthy Data Repositories : liste alphabétique de ~140 entrepôts certifiés)

Rechercher dans les entrepôts qui vous intéressent

Les entrepôts de données intègrent des moteurs de recherche pour faciliter l’accès aux données qu’ils contiennent.

Les interfaces de recherche peuvent être plus ou moins développées suivant les entrepôts : filtres ou facettes, « advanced search » (recherche par champs), « browse » (parcourir)…

Certains entrepôts « génériques » moissonnent d’autres entrepôts. C’est le cas de Recherche.Data.gouv, l’entrepôt de données de la recherche et de l’enseignement supérieur français, qui répertorie, entre autres, des données de l’entrepôt de l’IRD DataSuds.

En savoir plus

Annabelle Filatre (2019). Rechercher des données in Annabelle Filatre, Hanka Hensens, Isabelle Nault. Visa pour la recherche en Sciences de l’environnement : Comprendre les données de la recherche, Rechercher, Gérer et Diffuser, p. 21-37