PGD Express

Source : photo de Brian Suman, licence Unsplash

Questions relatives à la documentation dans un PGD

Voici quelques exemples de questions qui vous seront posées à ce sujet dans un plan de gestion des données (PGD)[1]. Vous pouvez croiser une section qui portera le nom de « Documentation », « Métadonnées », « Schéma de métadonnées » ou une combinaison de ces termes.

  • Quelle documentation sera nécessaire pour que les données soient lues et interprétées correctement à l’avenir?
  • Quels sont vos principes, vos systèmes et vos principales normes en matière de gestion et de création de données ? Quelles métadonnées et quelle documentation conserverez-vous ?
  • Décrivez comment vous allez documenter vos données pour vous assurer qu’elles seront facilement lisibles et interprétées correctement tout au long du processus de recherche.
  • Précisez les normes de données ou de métadonnées utilisées pour soutenir votre projet de recherche.
  • Comment veillerez-vous à ce que la documentation soit créée ou saisie de manière uniformisée et systématique tout au long de votre projet? Qui sera responsable de cette tâche?
  • Quelles métadonnées et quelle documentation (par exemple méthodologie de collecte et mode d’organisation des données) accompagneront les données ?
  • Les métadonnées seront-elles proposées de manière à pouvoir être moissonnées et indexées?

PGD Express

Documentation

Indiquez, selon le type de données que vous allez utiliser, quelle méthode de documentation vous allez employer. Votre documentation devra entre autres permettre de répondre aux questions suivantes à propos des données :

  • De quoi s’agit-il?
  • Qui les a créées?
  • Quand ont-elles été créées?
  • Comment ont-elles été créées?
  • Où ont-elles été récoltées/produites?

Exemple 1 : j’effectue une recherche où je vais recueillir des échantillons dans la toundra et les analyser ensuite en laboratoire

Avant de partir pour l’expédition, l’ensemble de l’équipe sera informé de quelle façon collecter et documenter les échantillons et les membres auront cette information avec eux sous format papier et électronique. La documentation lors de l’échantillonnage sera effectuée par le biais d’un formulaire papier uniforme qui indiquera quelle personne a effectué le prélèvement, à quel endroit, à quel moment et les conditions environnementales lors de la collecte. Le schéma de métadonnées ISO 19115 sera utilisé pour les coordonnées géographiques. Chaque soir, les formulaires seront pris en photo et identifiés de façon à relier l’échantillon, le papier et le numérique par leur nom.

De retour en laboratoire, les manuels d’utilisation des instruments et des logiciels seront disponibles à l’ensemble de l’équipe. La documentation terrain sera saisie sur ordinateur, dans un formulaire uniformisé. Les tests et les analyses seront documentés avec un cahier de laboratoire électronique (à déterminer).

Exemple 2 : jeffectue une recherche où je vais effectuer des entrevues qualitatives et des sondages auprès d’une population ciblée

Un guide d’entretien sera utilisé pour indiquer le contexte des entrevues et les questions à poser. Nous aurons recours à une piste de vérification (audit trail) pour les suivis et les modifications. Elle sera combinée au guide d’entretien.

Les résultats de sondages seront accompagnés d’un dictionnaire de données pour expliquer les variables, les codes employés et lister les questions.

Le codage utilisé pour faire l’analyse des réponses sera déposé dans GitHub.

Exemple 3 : j’effectue une recherche où je vais analyser un livre du Moyen-Âge en rapport avec une toile de la même époque :

Une méthodologie détaillée accompagnera la recherche et servira de base au fichier LISEZ-MOI qui sera déposé avec les données à la fin du projet.

Chaque photo du livre et de la toile sera documentée (date, lieu, contexte, description de l’élément photographié, qui a pris la photo et pourquoi) dans un fichier texte.

Les sources de documentation consultées (articles, livres, archives) seront listées dans un outil de gestion bibliographique (à déterminer).

Exemple 4 : je supervise un projet de recherche avec de nombreuses personnes impliquées, de différents établissements, et un grand nombre de types de données

Un comité formé de représentants des divers établissements sera responsable de définir les standards et les normes à respecter en matière de documentation et de les inscrire dans un guide.

Le guide expliquant de quelle façon documenter la recherche sera disponible à la racine de l’espace numérique utilisé par les équipes. Celui-ci sera mis à jour régulièrement et l’équipe sera informée lors des réunions et par courriel lorsqu’il y a des changements.

Une personne responsable dans chacune des équipes effectuera le contrôle de qualité (tel que décrit dans le guide) sur les données de son équipe.

Chaque membre de l’équipe devra documenter ses données et les traitements effectués sur celles-ci en suivant les recommandations du guide.

Exemple 5 : je réutilise des données déjà existantes

Les données préexistantes seront accompagnées d’une certaine documentation dans laquelle il sera possible de trouver des informations à propos de :

  • « leur provenance (corpus, archives…)
  • sur quels critères elles ont été sélectionnées
  • les conditions de réutilisations préexistantes de ces données » (Inist-CNRS, 2023)

Les données ne seront pas repartagées, mais les informations ci-dessus accompagneront le jeu de données du nouveau projet.

Normes et métadonnées

Les plans de gestion de données abordent souvent dans cette section des questions qui sont très liées, mais pas exclusivement, aux dépôts de données.

Des standards disciplinaires ou non seront peut-être utilisés pendant le projet de recherche, c’est l’occasion de les lister!

Exemples

L’utilisation d’un dépôt de données rendra les informations descriptives inscrites dans les champs de métadonnées compréhensibles par les machines et elles pourront être indexées. Un fichier au format CSV ou TXT qui accompagne vos données et contient vos métadonnées sera lisible par l’homme, mais son contenu ne sera pas indexé par les machines et sera donc invisible pour les moteurs de recherche et les autres dépôts de données.

Exemples

Voici quelques exemples de réponses possible en lien avec l’utilisation des dépôts de données (traduction de Brenel, et al. 2023) :

  • « Les données seront déposées dans des dépôts (indiquez les noms dans la mesure du possible) qui permettront de moissonner et d’indexer les métadonnées en vue d’une utilisation à long terme.
  • Les données ne seront pas stockées dans des dépôts. Les métadonnées seront simplement décrites par un fichier CSV. Elles seront donc lisibles par l’homme, mais ni moissonnées ni indexées.
  • Afin de faciliter la combinaison avec d’autres données, un format ouvert et non propriétaire ainsi qu’un vocabulaire commun à la communauté scientifique seront utilisés. Les métadonnées seront lisibles par machine et normalisées (Dublin Core, DataCite, DDI, etc.).
  • Le standard de métadonnées sera défini par le dépôt choisi (il sera décidé au courant de l’avancement du projet). »

Liste de validation

Dans votre plan de gestion des données, vous avez mentionné les éléments suivants :

Source : Liste de validation – Documentation, Émilie Fortin, CC BY 4.0

Bibliographie

Brenel, M., Diallo, M., Mainali, S., Mercier, C., Shi, Z., & Suhan, S. (2023). Guidelines for Data Management Plan within the framework of Horizon Europe: RIA, IA, CSA, EIC Pathfinder, Cofund. (Version 1). https://doi.org/10.5281/zenodo.10123889

Inist-CNRS. (2023). Parcours interactif sur la gestion des données de la recherche. DORANum. https://doi.org/10.13143/3XNZ-AS06


Licence

Autoformation : comment rédiger un plan de gestion des données© par Émilie Fortin. Tous droits réservés.

Partagez ce livre