Stagiaire en sauvetage de données : Jess Lerminiaux À l’automne 2024, j’ai eu l’occasion de participer à un stage de sauvetage de données du Projet Living Data, poursuivant ainsi le travail d’Erica Fellin, stagiaire précédente. Ce stage consistait à organiser et à nettoyer les données historiques sur la qualité de l’eau de la réserve nationale de faune de Saint-Denis (RNFSD), recueillies par des membres d’Environnement et Changement climatique Canada (ECCC), de l’University of Regina et de l’University of Saskatchewan. L’objectif était de publier les données sur DataStream, une plateforme en libre accès dédiée aux données sur la qualité de l’eau. La RNFSD est une zone de 3,61 km² créée en 1967 pour faciliter la recherche sur les impacts des activités agricoles sur les milieux humides de la région des fondrières des Prairies, un paysage façonné par la glaciation. La RNFSD comprend 200 bassins humides, des habitats forestiers de trembles, des prairies naturelles de fétuques et des terres cultivées. Les milieux humides jouent un rôle essentiel dans le maintien de diverses populations de sauvagine, constituant des habitats essentiels à leur reproduction et à leur croissance.
ECCC a échantillonné diverses zones humides de la RNFSD de 1993 à 1999, tandis que les recherches menées par l’University of Regina et l’University of Saskatchewan ont débuté en 2006 et se poursuivent encore aujourd’hui. Les données recueillies portent sur divers paramètres de la qualité de l’eau (température, pH, conductivité, salinité, oxygène dissous, turbidité, concentration en chlorophylle a, dureté, etc.), les teneurs en nutriments (diverses formes d’azote et de phosphore), les caractéristiques des sédiments (analyses élémentaires, concentration en méthylmercure, etc.), les concentrations de gaz à effet de serre (CO2, CH4), etc. Tout au long de mon stage, j’ai développé une série de scripts sur R pour nettoyer, organiser et préparer les données en vue de leur publication. Travailler avec des ensembles de données historiques a renforcé mon appréciation pour une documentation rigoureuse, incluant des annotations claires, des variables bien étiquetées et des explications détaillées garantissant que les données soient compréhensibles pour d’autres. Je vais appliquer cette approche à mes propres recherches et veiller à ce que mes données soient parfaitement documentées et facilement interprétables, favorisant ainsi la transparence et la reproductibilité. La quasi-totalité des données de la RNFSD a été publiée sur DataStream. Quelques variables n’ont pas pu être téléchargées faute de métadonnées ; la recherche de leurs détails est toutefois en cours. Les DOI des données publiées sont disponibles ci-dessous. Tous les scripts R, données brutes, données nettoyées et métadonnées des deux groupes de données sont hébergés dans le projet Open Science Framework : https://osf.io/ckw5t/?view_only=4a2926bf5ed34efeacc0d5e2c061b9ab. DOI pour les données collectées par ECCC : https://doi.org/10.25976/2mj9-z916 DOI pour les données collectées par les universités de Regina et de la Saskatchewan : https://doi.org/10.25976/uh9o-y093 Comments are closed.
|