CIEE/ICEE
  • Home
  • Living Data
    • Courses
    • LDP Certificates
    • Data Rescue Projects
    • Living Data Stories
    • Working Groups
  • Working Groups
    • About
    • Apply
  • Training
    • CIEE Workshops and Training
  • Apply
    • To host a Data Rescue Project
    • To host a workshop
  • News
  • Outputs
    • Datasets
    • Publications
    • Documentary
  • Get Involved
    • Membership
    • Donations
    • Governance
    • Contact
  • Accueil
  • Données vivantes
    • Cours
    • LDP Certificats
    • projet de sauvetage de données
    • Histoires de données vivantes
    • Groupes de travail
  • Groupes de travail
    • À Propos
    • POSTULER
  • Formation
    • Ateliers et formations de l’ICEE
  • POSTULER
    • Héberger un projet de sauvetage de données
    • Animer un atelier
  • Nouvelles
  • La Production
    • Ensembles de données
    • Publications
    • Documentary
  • COMMENT S’ENGAGER
    • Adhésion
    • Faire un Don
    • Gouvernance
    • Nous Joindre

HISTOIRES DE PROJETS DE DONNÉES VIVANTES​

SAUVETAGE DE 40 ANS DE DONNÉES SUR LES INVERTÉBRÉS BENTHIQUES DANS LE BASSIN VERSANT DES LACS TURKEY EN ONTARIO

7/31/2025

 
​Stagiaire en sauvetage de données : Diana Bertuol Garcia

De décembre 2024 à février 2025, j’ai travaillé comme stagiaire en sauvetage de données au ministère des Pêches et des Océans (MPO), en Ontario. Depuis les années 1980, le bureau du MPO à Sault Ste. Marie, en Ontario, prélève des échantillons de sédiments lacustres et fluviaux afin de caractériser les communautés benthiques des différents plans d’eau ontariens et d’évaluer l’ampleur de la variabilité temporelle et spatiale de la composition des espèces selon les saisons, les années, les profondeurs et les différents lacs. La majeure partie des travaux a été concentrée dans le bassin versant des lacs Turkey dans le cadre du projet de suivi des effets des pluies acides sur les écosystèmes terrestres et aquatiques. De nombreux sous-projets relatifs aux communautés benthiques ont été menés au fil des ans, avec des efforts variables de collecte de données selon la durée et de financement de chaque sous-projet. La plupart des données ayant été recueillies dans les années 1980, la majorité des personnes ayant participé à la collecte de données avaient déjà quitté l’organisation. Les données étaient dispersées dans des fichiers Excel et de nombreux fichiers PDF de documents anciens numérisés, sans documentation ni pièces explicatives. Mon objectif durant ce stage était donc d’organiser ces fichiers en un ensemble de données relationnelles cohérent et bien documenté, facilement importable sur le portail gouvernemental de données ouvertes.
Picture
Photo, gracieuseté de Pêches et Océans Canada à Sault Ste. Marie (Ontario).
Au début de mon stage, j’ai passé beaucoup de temps à examiner chaque fichier Excel et PDF pour comprendre quelles données étaient disponibles et comment elles étaient liées entre elles. J’avais l’impression d’être une détective, essayant de déchiffrer des bribes d’information pour reconstituer le puzzle. Par exemple, certains fichiers PDF contenaient des informations sur le nombre de spécimens d’espèces d’invertébrés dans différents échantillons, mais je ne pouvais pas déterminer, à partir de ces pages, où les échantillons avaient été prélevés ni quelles méthodes avaient été utilisées. Cependant, je trouvais ensuite des notes dans un autre fichier expliquant les codes d’échantillonnage utilisés et leur correspondance avec les emplacements sur une carte, puis un autre fichier reliant ces codes aux méthodes spécifiques employées, comme la benne Ekman ou l’échantillonnage par « technique du coup de pied ». Finalement, petit à petit, j’ai pu reconstituer le puzzle et comprendre quelles données étaient disponibles, comment et où elles avaient été collectées.

L’étape suivante consistait à transcrire les données du format PDF en format tabulaire, une tâche pour laquelle j’ai heureusement bénéficié de l’aide d’un assistant de recherche étudiant (et d’outils d’IA facilitant la conversion des données PDF en tableaux). Une fois toutes les données en format tabulaire, j’ai consacré le reste de mon stage à l’utilisation de R pour identifier les données dupliquées, normaliser les noms de taxons, formater le tout dans une base de données relationnelle et effectuer une validation des données afin de garantir leur qualité et leur organisation. Ce fut extrêmement gratifiant de voir tous ces fichiers PDF et Excel désorganisés prendre forme et être présentés dans un format utilisable et compréhensible pour les futurs chercheurs et chercheuses.

​J’ai beaucoup appris sur les meilleures pratiques en matière de gestion des données, de documentation des données et de reproductibilité, ainsi que sur la manière de construire et de structurer des bases de données relationnelles, et (pourquoi pas, étant donné que je suis une écologiste végétale) sur l’échantillonnage par « technique du coup de pied » et autres méthodes d’échantillonnage du benthos.
Picture
Photo, gracieuseté de Pêches et Océans Canada à Sault Ste. Marie (Ontario).

Comments are closed.

    Archives

    August 2025
    July 2025
    February 2025
    January 2025
    December 2024
    October 2024
    September 2024
    May 2024
    April 2024
    December 2023
    October 2023
    August 2023
    July 2023
    April 2023
    March 2023
    February 2023

    CatÉgories

    All

    RSS Feed

Home
Synthesis
Training
Living Data
Funding
News
Membership

Contact

  • Home
  • Living Data
    • Courses
    • LDP Certificates
    • Data Rescue Projects
    • Living Data Stories
    • Working Groups
  • Working Groups
    • About
    • Apply
  • Training
    • CIEE Workshops and Training
  • Apply
    • To host a Data Rescue Project
    • To host a workshop
  • News
  • Outputs
    • Datasets
    • Publications
    • Documentary
  • Get Involved
    • Membership
    • Donations
    • Governance
    • Contact
  • Accueil
  • Données vivantes
    • Cours
    • LDP Certificats
    • projet de sauvetage de données
    • Histoires de données vivantes
    • Groupes de travail
  • Groupes de travail
    • À Propos
    • POSTULER
  • Formation
    • Ateliers et formations de l’ICEE
  • POSTULER
    • Héberger un projet de sauvetage de données
    • Animer un atelier
  • Nouvelles
  • La Production
    • Ensembles de données
    • Publications
    • Documentary
  • COMMENT S’ENGAGER
    • Adhésion
    • Faire un Don
    • Gouvernance
    • Nous Joindre