La sauvegarde des fichiers de données doit être automatique et régulière : une périodicité de sauvegarde doit être définie.

Si vous développez du code, il faut sauvegarder le code comme les données.

Si plusieurs personnes travaillent sur les données, des règles de sauvegarde communes doivent adoptées et partagées.

 

Il est conseillé de conserver :

  • Au moins 3 versions successives, nommées clairement et différemment :
    en cas de problème sur une version de fichier, on pourra réinstaller la précédente
  • Au moins 3 copies de chaque version, dans au moins 2 lieux différents.
    Par exemple : l’original, une copie externe locale (disque dur externe, autre ordinateur,…) et une copie externe distante (cloud*, espace serveur,…)
    *Le cloud peut être personnel comme Google Drive, Drop Box, etc.. Cependant  il est vivement conseillé d’utiliser les outils collectifs mis à disposition des chercheurs

Une astuce : la règle du 3-2-1 
Pour une bonne sécurisation des données et de tous documents, il est recommandé de faire 3
copies, sur 2 supports différents (ex : ordinateur, disque dur externe, clé USB, serveur
institutionnel, entrepôt de données, etc.), dont une au moins à distance (en dehors du bureau).
source  https://doranum.fr/stockage-archivage/stockage-donnees/

Des règles de nommage des fichiers et d’arborescence des répertoires peuvent aussi être définies pour faciliter l’accès aux fichiers.
Le guide Best Practices for File Naming ».  Stanford Libraries aborde les bonnes pratiques et donne aussi des exemples.

La DDUNI de l’IRD propose aux  scientifique possédant un accès authentifié aux ressources IRD,  plusieurs services pour la sauvegarde et le stockage des données, au cours du projet et en fin de projet, localement et à distance , différents selon la taille des fichiers et la durée de conservation désirée.
La DDUNI peut aussi vous conseiller sur le transfert et l’accès sécurisés aux données.
Merci de contacter l’assistance informatique (lien intranet), après avoir défini et précisé vos besoins.

Une fois les données consolidées, et documentées, vous pouvez déposer certains de vos jeux de données dans un entrepôt, comme celui de l’IRD, pour les préserver, faire connaître leur existence et les partager directement ou à la demande, par exemple à l’occasion d’une publication.

Références :

University, of Stanford California . « Best Practices for File Naming ». Stanford Libraries. Consu
lté le 2 juillet 2019. https://library.stanford.edu/research/data-management-services/data-best-practices/best-practices-file-naming.
Wrublewski, Donna. « LibGuides: Research Data Management: Data Backup ». Consulté le 25 juin 2019. https://libguides.caltech.edu/c.php?g=512677&p=3502743.
Doranum . https://doranum.fr/stockage-archivage/stockage-donnees/