La stagiaire de sauvetage de données : Nadia Páez Conservation de la nature Canada (CNC) est un organisme sans but lucratif pour la conservation des terres. Dans le cadre d'évaluations de référence et de projets de suivi, CNC recueille des données sur certaines espèces depuis plus de 30 ans en Alberta. Ces registres d'espèces avaient une grande valeur potentielle pour la province de l'Alberta. Cependant, ils étaient stockés dans une base de données privée de CNC pas compatible avec les deux référentiels provinciaux de la biodiversité : la base de données «Fisheries and Wildlife Management Information System» (FWMIS) et le «Alberta Conservation Information Management System» (ACIMS) pour les enregistrements de plantes et d'invertébrés. L’objectif de ce stage était ainsi de construire un pipeline numérique entre les dépôts de CNC et ceux de l’Alberta, afin de permettre le transfert de données historiques et futures du domaine privé au domaine public. Pour ce faire, la doctorante Nadia Páez a travaillé avec la coordonnatrice des données et de l’information, Beth McLarnon, et le directeur de la science et de la planification de la conservation, Craig Harding, de CNC Alberta sous la direction des membres du PLD, les professeures Ellen Bledsoe et Diane Srivastava afin de développer un projet R permettant d’abord d’évaluer la qualité des données à transférer puis de les formater pour répondre aux exigences de soumission du dépôt provincial. Le développement de scripts reproductibles a permis la gestion de grandes quantités de données. Ces scripts sont précieux non seulement pour transférer les enregistrements historiques, mais aussi pour archiver les données qui seront collectées dans l’avenir.
Pour les données historiques, nous avons évalué à l’aide d’un script si les informations nécessaires étaient présentes (date d’observation, lieu et identification de l’espèce). Les informations manquantes étaient complétées manuellement lorsque possible. À l’inverse, lorsque ces informations étaient impossibles à trouver, les données étaient exclues. Le script vérifiait également que les données avaient été prélevées dans les limites provinciales de l’Alberta. Cela nous a permis de détecter certaines erreurs dans les coordonnées d’origine. Un autre défi consistait à évaluer la validité des noms d’espèces puisque les systèmes taxonomiques utilisés par les bases de données de CNC et de l’Alberta diffèrent. Une fois les données nettoyées, un script de transfert a normalisé les données au format requis de coordonnées, de dates et de noms d’espèces. De plus, seuls certains enregistrements de plantes et d’invertébrés peuvent être soumis à l’ACIMS, nous avons donc filtré les enregistrements de la CNC en fonction de ces groupes taxonomiques. Nous avons ainsi traité 32 300 enregistrements historiques collectés sur 18 ans, à partir desquels nous avons pu exporter 8745 enregistrements. Parmi ceux-ci, 8701 sont des observations de vertébrés appartenant à 318 espèces de 113 emplacements, et 44 sont des observations de plantes et d’invertébrés de 22 localités et de 25 espèces différentes. Ces informations sont désormais disponibles sur les bases de données « Fisheries and Wildlife Management Information System – FWMIS » https://www.alberta.ca/fisheries-and-wildlife-management-information-system.aspx et « Alberta Conservation Information Management System – ACIMS » https://www.albertaparks.ca/albertaparksca/management-land-use/alberta-conservation-information-management-system-acims/.
0 Comments
Leave a Reply. |
Archives
October 2024
CatÉgories |