CIEE/ICEE
  • Home
  • Living Data
    • Courses
    • LDP Certificates
    • Internships
    • Living Data Stories
    • Working Groups
  • Working Groups
    • About
    • Apply
  • Training
    • CIEE Workshops and Training
  • Apply
    • For a Data Rescue Internship
    • To host a workshop
    • LDP PostDoc Positions
  • News
  • Outputs
    • Datasets
    • Publications
    • Documentary
  • Get Involved
    • Membership
    • Donations
    • Governance
    • Contact
  • Accueil
  • Données vivantes
    • Cours
    • LDP Certificats
    • Stages
    • Histoires de données vivantes
    • Groupes de travail
  • Groupes de travail
    • À Propos
    • POSTULER
  • Formation
    • Ateliers et formations de l’ICEE
  • POSTULER
    • Effectuer un stage de sauvetage de données
    • Animer un atelier
    • Occasion de stage postdoctoral PLD
  • Nouvelles
  • La Production
    • Ensembles de données
    • Publications
    • Documentary
  • COMMENT S’ENGAGER
    • Adhésion
    • Faire un Don
    • Gouvernance
    • Nous Joindre

HISTOIRES DE PROJETS DE DONNÉES VIVANTES​

SUIVI DE NIDIFICATION D’OISEAUX NICHEURS DE LA SASKATCHEWAN (ANNÉES 1940 À AUJOURD’HUI)

4/12/2023

 
Stagiaire en sauvetage de données : Billi Krochuk
 
Les populations d’oiseaux ont connu des déclins marqués au Canada au cours des dernières décennies. Les espèces d’oiseaux des prairies sont parmi celles qui ont connu les plus fortes baisses de population. Au Canada, ces espèces ont ainsi connu des déclins d’environ 60 % depuis les années 1970. Cela est principalement causé par la perte ou la dégradation de l’habitat, que ce soit par la conversion à l’agriculture commerciale en monoculture ou par de mauvaises pratiques de gestion des terres. Il est donc important de surveiller ces espèces. La compréhension des schémas de phénologie de la reproduction est essentielle pour guider les efforts de gestion et de conservation à travers le pays. La province de la Saskatchewan dispose d’un ensemble de données à long terme sur les nids d’oiseaux nicheurs, remontant aux années 1940 et 1950. Jusqu’à présent, les relevés de nids étaient conservés dans de multiples formats (feuilles de calcul, cartes de données papier) et n’avaient jamais fait l’objet d’une évaluation de la qualité ni d’un nettoyage. La nature hétérogène du système de données les exposait à un risque élevé de perte. Les relevés historiques de nids sont très utiles pour établir la répartition et les mesures historiques des populations d’oiseaux, ainsi que pour évaluer les changements au fil du temps, notamment l’expansion ou la contraction de l’aire de répartition et les changements dans la taille des couvées. La sauvegarde des enregistrements de nidification nécessitait de nettoyer et de contrôler la qualité des données avant de les archiver dans un référentiel ouvert, permanent et accessible pour faciliter leur utilisation future. La récupération de ces données a été entreprise par l’University of Regina, le Royal Saskatchewan Museum, le Saskatchewan Conservation Data Centre (CDC) et le ministère de l’Environnement de la Saskatchewan, ainsi que par deux stagiaires aux cycles supérieurs et deux personnes assistantes au premier cycle.

​L’un des aspects les plus difficiles du processus de récupération des données a été de gérer les différents formats de stockage. Les relevés historiques des nids étaient stockés sur des fiches de nids physiques dans des classeurs au CDC de la Saskatchewan, à Regina. De plus, les données avaient été saisies par plusieurs personnes différentes (employés, bénévoles et scientifiques amateurs) dans le Programme de suivi des nids d’Oiseaux Canada. Certaines données avaient été saisies manuellement et d’autres à l’aide d’un formulaire Scantron. Cependant, aucune de ces méthodes de stockage ne conserve les données dans un format approprié pour une utilisation par le CDC de la Saskatchewan. La base de données du Programme de suivi des nids comprend environ 18 800 enregistrements de nids uniques. Mener à bien le processus de récupération et d’archivage d’une base de données aussi importante nécessite une équipe de stagiaires aux études et de personnes mentores. En 2020, Kelsey Bell, de l’University of Regina, a été chargée d’examiner la qualité des données et d’élaborer un plan pour les nettoyer et préparer leur récupération et leur archivage. Josh Christiansen, également de l’University of Regina, a participé à la récupération des données à titre d’assistant de premier cycle.
 
Pour commencer, Kelsey a travaillé à la création d’un protocole de contrôle de qualité reproductible pour les emplacements des nids. Plusieurs problèmes ont été découverts, comme des emplacements manquants, des emplacements aberrants (c.-à-d. des nids situés à l’extérieur de la Saskatchewan) et plus de 4 000 enregistrements avec exactement les mêmes coordonnées. Josh a travaillé à la récupération des données de localisation en se rendant au bureau du CDC de la Saskatchewan, en trouvant les cartes de nids physiques et en corrigeant les données de localisation (si possible). L’étape suivante consistait à concevoir une méthode reproductible pour transformer la base de données du Programme de suivi des nids d’Oiseaux Canada afin qu’elle corresponde au modèle du CDC de la Saskatchewan. Comme le Programme de suivi des nids d’Oiseaux Canada est toujours en cours, les données devront être contrôlées et modifiées chaque année. Il était ainsi important de trouver une solution pouvant être utilisée année après année avec les nouvelles données. Le dernier défi de Kelsey, et le plus grand, était de définir et de coder un ensemble de règles pour estimer la précision de la localisation. La base de données de suivi des nids d’Oiseaux Canada n’inclut normalement pas de colonne sur la précision des données. À l’inverse, l’évaluation de la précision est une donnée critique dans la base de données du CDC de la Saskatchewan. En s’appuyant sur différentes sources de coordonnées (GPS, cartes, codes postaux, etc.), Kelsey a développé un ensemble de règles reproductibles de manière à déterminer un niveau de précision pour les localisations des nids.
 
En 2021, Billi Krochuk, de l’University of British Columbia, s’est penchée sur les données de reproduction, notamment la date d’observation et la taille de la couvée. Toutes les valeurs ont été évaluées au niveau de chaque espèce. Elle a rassemblé des informations sur la saison de reproduction auprès d’Oiseaux Canada et du Relevé des oiseaux nicheurs de la Saskatchewan, ainsi que des informations sur les couvées auprès de Birds of the World et du Saskatchewan Breeding Bird Atlas. Avec ces détails propres à chaque espèce, elle a développé des filtres de contrôle de la qualité. Tous les enregistrements signalés comme étant en avance (48 enregistrements), une semaine en avance (65 enregistrements), une semaine en retard (266 enregistrements) ou en retard (179 enregistrements) ont été évalués. Ils étaient alors considérés comme des valeurs hors normes légitimes ou leurs fiches d’origine étaient vérifiées par Michelle Desjarlais, de l’University of Regina, pour s’assurer qu’il n’y avait pas de problèmes de mauvaise lecture des nombres par Scantron, ou qu’il n’y avait pas de cas où les valeurs du mois et du jour avaient été inversées (potentiellement jusqu’à 34 enregistrements). Michelle a aussi trouvé 95 fiches de nidification individuelles pour lesquelles il n’y avait aucune information de date dans la base de données. Seuls trois enregistrements sont ressortis comme ayant un nombre d’œufs ou de poussins inhabituellement élevé, mais leur légitimité a pu être confirmée. Les enregistrements d’œufs ont aussi été évalués pour déterminer s’ils étaient inhabituellement tardifs et les enregistrements de poussins pour s’assurer qu’ils n’étaient pas inhabituellement précoces.
 
À la fin des deux premières périodes de stage, l’équipe a pu récupérer près de 3 000 enregistrements de nids. Cela n’aurait pas été possible sans le travail acharné de Josh et de Michelle pour corriger manuellement les données sur la localisation et la biologie de la reproduction. De plus, la base de données a été transformée en un format ordonné et utilisable pour le CDC de la Saskatchewan et des règles d’estimation de la localisation ont été définies et établies. Ce fut certainement un travail difficile et plein de défis, mais aussi très enrichissant. Kelsey, Billi, Josh et Michelle ont pu travailler avec une excellente équipe de la province de la Saskatchewan, ainsi qu’avec Ryan Fisher (Royal Saskatchewan Museum) et Andrea Benville (Saskatchewan CDC). Remerciements particuliers à Ellen Bledsoe (University of Regina) pour tous les conseils et avis sur R et GitHub.

Comments are closed.

    Archives

    July 2025
    February 2025
    January 2025
    December 2024
    October 2024
    September 2024
    May 2024
    April 2024
    December 2023
    October 2023
    August 2023
    July 2023
    April 2023
    March 2023
    February 2023

    CatÉgories

    All

    RSS Feed

Home
Synthesis
Training
Living Data
Funding
News
Membership

Contact

  • Home
  • Living Data
    • Courses
    • LDP Certificates
    • Internships
    • Living Data Stories
    • Working Groups
  • Working Groups
    • About
    • Apply
  • Training
    • CIEE Workshops and Training
  • Apply
    • For a Data Rescue Internship
    • To host a workshop
    • LDP PostDoc Positions
  • News
  • Outputs
    • Datasets
    • Publications
    • Documentary
  • Get Involved
    • Membership
    • Donations
    • Governance
    • Contact
  • Accueil
  • Données vivantes
    • Cours
    • LDP Certificats
    • Stages
    • Histoires de données vivantes
    • Groupes de travail
  • Groupes de travail
    • À Propos
    • POSTULER
  • Formation
    • Ateliers et formations de l’ICEE
  • POSTULER
    • Effectuer un stage de sauvetage de données
    • Animer un atelier
    • Occasion de stage postdoctoral PLD
  • Nouvelles
  • La Production
    • Ensembles de données
    • Publications
    • Documentary
  • COMMENT S’ENGAGER
    • Adhésion
    • Faire un Don
    • Gouvernance
    • Nous Joindre