Aller plus loin : les principes FAIR

Dessins montrant l'interprétation de chacune des lettres de l'acronyme FAIR
Source : The Open Science Training Handbook, Foster, CC0 1.0 Universal

(Le texte suivant est tiré de la foire aux questions de la Politique des trois organismes sur la gestion des données de recherche, publiée en 2022).

« Les principes FAIR pour la gestion et l’intendance des données scientifiques constituent une pratique exemplaire internationale pour optimiser l’utilisation des données de recherches et des métadonnées associées, à la fois par les humains et par les ordinateurs.

Facile à trouver (Findable): la première étape de la (ré)utilisation des données consiste à les trouver. Les métadonnées et les données doivent être faciles à trouver, tant pour les humains que pour les ordinateurs. »

Exercice

Allez sur Google Dataset Search et cherchez « The phonological loop: is speech special? »

Le jeu de données a été déposé dans la collection institutionnelle de l’Université Laval de Borealis, le dépôt Dataverse canadien. Les métadonnées, comme le titre, ont été moissonnés par Google, ce qui rend le jeu de données repérable sur le Web.

« Accessible (Accessible): une fois qu’une personne a trouvé les données requises, elle doit savoir comment y accéder (spécification des conditions d’accès et d’utilisation). Cela ne signifie pas nécessairement des données ouvertes, mais l’accès aux métadonnées et l’information sur la façon dont vous pouvez accéder aux données. »

Exercice

Avec le résultat de votre recherche sur Google Dataset Search, vous avez un bouton qui vous invite à aller découvrir le jeu de données. Le bouton utilise l’hyperlien pérenne de Borealis, le DOI, pour vous mener à bon port. Cliquez sur le bouton.

« Interopérable (Interoperable): généralement, les données doivent être intégrées à d’autres données. En outre, les données doivent être interopérables (technologiquement et sémantiquement), c’est-à-dire qu’elles doivent être conservées dans des formats normalisés et ouverts qui peuvent être compris par une multitude d’applications. »

Exercice

Regardez le type de données présentes dans l’ensemble « The phonological loop: is speech special? ». Selon vous, les formats sont-ils interopérables?

Dans l’ensemble se retrouvent des fichiers WAV, XLSX, EXP, SCE et TEM. Le fichier tabulaire XLSX explique les fichiers WAV qui forment le cœur des données. Le format WAV est un format ouvert de qualité utilisé par plusieurs établissements pour la préservation à long terme. Il peut être ouvert par différents logiciels, il est interopérable.

« Réutilisable (Reusable): l’objectif ultime de FAIR est d’optimiser la réutilisation des données. Pour y parvenir, les métadonnées et les données doivent être bien décrites afin qu’elles puissent être reproduites et (ou) combinées dans différents contextes. »

Exercice

Tous les jeux de données dans Borealis ont une licence. Est-ce que la licence attribuée à l’ensemble « The phonological loop: is speech special? » vous permet de réutiliser les données?

Il s’agit de la licence CC BY-NC. Ce n’est pas la plus permissive, mais elle permet la réutilisation des données si l’origine de celle-ci est mentionnée (Borealis a une fonction qui simplifie les citations). L’utilisation commerciale du jeu de données est néanmoins proscrite.

« Toutes les données peuvent être FAIR, mais toutes les données FAIR ne sont pas ouvertes. OpenAIRE précise que les données doivent être « aussi ouvertes que possible, aussi fermées que nécessaire ». Toutes les données ne peuvent pas être totalement ouvertes, mais elles doivent toujours être trouvables au niveau des métadonnées.» (Traduction, UBC Library Research Commons, 2023).

L’application des principes FAIR ne doit pas remplacer la souveraineté des données autochtones ou d’autres considérations culturelles, éthiques, juridiques ou commerciales.

Source : Métadonnées : quels avantages par Mireille Brenel, Luc Zuindeau, CC BY 4.0

Ressources FAIR

Pour en savoir plus sur les principes FAIR, consultez le site GO FAIR ou la section sur FAIR dans le parcours interactif DoRANum sur la gestion des données de recherche.

Par ailleurs, voici deux sites Web qui fournissent des trucs et conseils pour adhérer aux principes FAIR et qui permettent d’évaluer un jeu de données.

Enfin, The FAIR Cookbook est un exemple d’une ressource disciplinaire (sciences de la vie) sur les principes FAIR.

Bibliographie

Barsky, E., & Hu, B. (2023). Documentation and Metadata [Formation]. Research Data Management. https://ubc-library-rc.github.io/rdm/content/06-2_Documentation_Metadata.html

Bracco, L., Brenel, M., Du Pasquier, D., Gauvrit, G., Heude, C., Lemeltier, D., Rousselot, C., & Zuindeau, L. (2023, septembre 25). Décrire ses jeux de données dans les règles du FAIR : accompagner les chercheurs à l’utilisation des métadonnées. https://doi.org/10.5281/zenodo.8376581

Bezjak, S., Clyburne-Sherin, A., Conzett, P., Fernandes, P., Görögh, E., Helbig, K., Kramer, B., Labastida, I., Niemeyer, K., Psomopoulos, F., Ross-Hellauer, T., Schneider, R., Tennant, J., Verbakel, E., Brinken, H., & Heller, L. (2018). Open Science Training Handbook. Foster. https://doi.org/10.5281/zenodo.1212496

Brenel, Mireille, & Zuindeau, Luc. (2023). Métadonnées : quels avantages. Zenodo. https://doi.org/10.5281/zenodo.8369570 

Gouvernement du Canada. (2021). Foire aux questions. Politique des trois organismes sur la gestion des données de recherche. https://science.gc.ca/site/science/fr/financement-interorganismes-recherche/politiques-lignes-directrices/gestion-donnees-recherche/politique-trois-organismes-gestion-donnees-recherche-foire-aux-questions

Wang, M. & Savard, D. (2023). Les principes FAIR et la gestion des données de recherche. Dans La gestion des données de recherche dans le contexte canadien : Un guide pour la pratique et l’apprentissage. https://doi.org/10.5206/LOJM2483

Licence

Autoformation : comment rédiger un plan de gestion des données© par Émilie Fortin. Tous droits réservés.

Partagez ce livre