CIEE/ICEE
  • Home
  • Living Data
    • Courses
    • LDP Certificates
    • Internships
    • Living Data Stories
    • Working Groups
  • Working Groups
    • About
    • Apply
  • Training
    • CIEE Workshops and Training
  • Apply
    • For a Data Rescue Internship
    • To host a workshop
  • News
  • Outputs
    • Datasets
    • Publications
    • Documentary
  • Get Involved
    • Membership
    • Donations
    • Governance
    • Contact
  • Accueil
  • Données vivantes
    • Cours
    • LDP Certificats
    • Stages
    • Histoires de données vivantes
    • Groupes de travail
  • Groupes de travail
    • À Propos
    • POSTULER
  • Formation
    • Ateliers et formations de l’ICEE
  • POSTULER
    • Effectuer un stage de sauvetage de données
    • Animer un atelier
  • Nouvelles
  • La Production
    • Ensembles de données
    • Publications
    • Documentary
  • COMMENT S’ENGAGER
    • Adhésion
    • Faire un Don
    • Gouvernance
    • Nous Joindre

HISTOIRES DE PROJETS DE DONNÉES VIVANTES​

BASE DE DONNÉES DE SUIVI À LONG TERME DU BASSIN VERSANT DES LACS TURKEY

4/12/2023

 
Stagiaire en sauvetage de données : 
Caroline Dallstream

La collecte de données écologiques à long terme dans le bassin versant des lacs Turkey en Ontario a débuté en 1979 dans le but d’évaluer les impacts des perturbations anthropiques sur son air, son eau, ses terres et ses communautés biologiques. L’étude a été lancée par Pêches et Océans Canada (MPO), Ressources naturelles Canada et Environnement et Changement climatique Canada avec pour mission initiale de déterminer les impacts des pluies acides dans le bassin versant, mais de nombreuses autres problématiques y ont été étudiées depuis. L’objectif principal du stage de sauvetage de données était de préparer les données recueillies par le MPO dans les lacs Turkey de 1979 à 2008 sur la chimie et la température de l’eau, la chlorophylle, le phytoplancton, les poissons, le benthos et le zooplancton afin de les rendre disponibles dans le portail de données ouvertes du gouvernement du Canada. Au départ, les fichiers de données existaient dans divers formats, notamment papier, Excel et une base de données Microsoft Access. Au cours du stage, le projet a été élargi pour inclure des données supplémentaires recueillies par le MPO dans les rivières Magpie et Batchawana et dans divers lacs d’amont en Ontario. 

En raison de la taille immense de la base de données, le stage d’automne 2021 n’a porté que sur les données de chlorophylle a. Les données originales existaient dans plusieurs formats et étaient souvent répétées dans plusieurs fichiers. Toutes les données pertinentes ont dû être trouvées dans les fichiers, puis reformatées afin d’être compatibles avec des programmes comme R et d’éviter toute perte d’informations (comme les notes d’analyse). Une fois chargées dans R, les données ont été nettoyées et standardisées puis groupées dans un fichier de données unique pour toutes les années et tous les lieux d’échantillonnage. Comme ces données ont été collectées sur plusieurs années par de nombreuses personnes, il existait plusieurs codifications pour les mêmes sites d’échantillonnage et les fichiers de chaque année étaient légèrement différents. Des méthodes reproductibles ont été utilisées pour réattribuer les noms et les numéros des sites d’échantillonnage en utilisant des tables relationnelles et un « codage souple ». Le nettoyage des données a mis en lumière certains problèmes subsistants dans les données, comme des valeurs anormalement élevées sur une période de deux ans dans les années 1980. Cette découverte a mené à une enquête sur les causes de ces valeurs inhabituelles et a inspiré l’inclusion d’une méthode transparente pour communiquer la qualité des données. Une colonne a ainsi été ajoutée aux données pour recommander des données à utiliser ou à exclure des analyses futures avec un code binaire. Un autre objectif du stage était d’améliorer la conception et la fonctionnalité de la base de données relationnelle. Cela comprenait la simplification des fichiers (entités) inclus dans la base de données relationnelle, la conversion des données et des fichiers en format épuré, l’élimination des informations et des fichiers redondants et la simplification des relations entre les fichiers. Ces changements rendront l’utilisation de la base de données plus intuitive et moins sujette aux erreurs et faciliteront la saisie et l’extraction continues des données par les chercheurs et chercheuses du MPO.
 
​Le travail effectué dans le cadre de ce stage a été soutenu par une grande équipe du MPO et a bénéficié de la contribution d’expert.es des différents projets du MPO, de l’histoire du bassin versant des lacs Turkey, ainsi que de la conception de bases de données relationnelles et de la gestion des données. Bien que de nombreuses données restent à nettoyer, la structure de la base de données a été grandement simplifiée et améliorée, ce qui devrait faciliter le nettoyage des données restantes et l’utilisation future de la base de données. Le nettoyage et la normalisation des données ont été soigneusement documentés pour permettre des transitions fluides entre les futurs experts et expertes en gestion de données qui s’efforcent de rendre ces données accessibles au public.



Comments are closed.

    Archives

    July 2025
    February 2025
    January 2025
    December 2024
    October 2024
    September 2024
    May 2024
    April 2024
    December 2023
    October 2023
    August 2023
    July 2023
    April 2023
    March 2023
    February 2023

    CatÉgories

    All

    RSS Feed

Home
Synthesis
Training
Living Data
Funding
News
Membership

Contact

  • Home
  • Living Data
    • Courses
    • LDP Certificates
    • Internships
    • Living Data Stories
    • Working Groups
  • Working Groups
    • About
    • Apply
  • Training
    • CIEE Workshops and Training
  • Apply
    • For a Data Rescue Internship
    • To host a workshop
  • News
  • Outputs
    • Datasets
    • Publications
    • Documentary
  • Get Involved
    • Membership
    • Donations
    • Governance
    • Contact
  • Accueil
  • Données vivantes
    • Cours
    • LDP Certificats
    • Stages
    • Histoires de données vivantes
    • Groupes de travail
  • Groupes de travail
    • À Propos
    • POSTULER
  • Formation
    • Ateliers et formations de l’ICEE
  • POSTULER
    • Effectuer un stage de sauvetage de données
    • Animer un atelier
  • Nouvelles
  • La Production
    • Ensembles de données
    • Publications
    • Documentary
  • COMMENT S’ENGAGER
    • Adhésion
    • Faire un Don
    • Gouvernance
    • Nous Joindre