Stagiaire en sauvetage de données :
Rolando Trejo-Pérez, Institut de recherche en biologie végétale (IRBV), Université de Montréal Durant l’été 2023, j’ai participé à un stage de sauvetage de données dans le cadre du Certificat en gestion des données et recherche reproductible. L’objectif principal de ce stage était de nettoyer et de transférer sur DataStream les données sur la qualité et la température de l’eau fournies par la Nova Scotia Salmon Association (NSSA). Cette transformation et ce nettoyage ont été réalisés à l’aide de scripts R reproductibles, garantissant la cohérence et la transparence du processus de conversion des données.
0 Comments
Stagiaire en sauvetage de données :
Marc Olivier Beausoleil Les inventaires canadiens des strigidés nocturnes visent à mieux comprendre les tendances démographiques des hiboux et des chouettes, mais également à fournir un aperçu de l’utilisation de l’habitat par ces oiseaux et de la manière dont ces informations peuvent améliorer les pratiques de gestion et de conservation des terres. La conduite de ces inventaires par des bénévoles de partout au Canada depuis plus de 20 ans a produit une quantité incroyable de données. Stagiaire en sauvetage de données :
Tanya Strydom Le projet Piping Plover (PIPL) se concentre sur le suivi des données liées au Pluvier siffleur, cet oiseau incroyablement mignon et malheureusement en voie de disparition. Ces petits échassiers sont des visiteurs estivaux des régions côtières de la côte atlantique où ils se reproduisent le long du rivage, nichant au-dessus de la ligne des hautes eaux dans des zones de sable fin à végétation clairsemée. Les pluviers siffleurs sont sensibles aux perturbations des plages et l’un des principaux objectifs du projet PIPL est de suivre non seulement l’état de la population des oiseaux, mais également l’effet des différentes perturbations sur celle-ci. Ceci est réalisé grâce à des études sur les plages. Ces études sont menées par une équipe de bénévoles et de partenaires qui visitent à plusieurs reprises un ensemble de plages pendant les mois d’été. Au cours de ces visites, ces personnes collectent des données sur l’état de la plage et cherchent des signes d’éventuelles perturbations, tant naturelles (comme les signes de prédateurs) qu’anthropiques (comme les traces de véhicules). Bien sûr, elles sont également à la recherche de véritables pluviers siffleurs ainsi que de nids potentiels. Lorsqu’un nid est trouvé, il est ensuite suivi jusqu’à ce que les poussins s’envolent (ou que les œufs/poussins soient perdus). Les données sur les nids incluent le nombre d’œufs, de poussins et d’oisillons, si possible, les nids sont également associés aux adultes (s’ils sont bagués). L’objectif spécifique de ce stage de sauvetage de données PLD était de regrouper tous les suivis des plages et des nids dans une base de données viable qui pourrait être téléchargée et archivée dans la plateforme de données en libre accès Nature Counts. Il fallait s’assurer que les étiquettes des variables et les codes utilisés correspondaient au formatage des données utilisé par Nature Counts. Cela a été fait pour les suivis effectués en Nouvelle-Écosse de 2006 à 2016 (les données à partir de 2017 étaient déjà archivées sur Nature Counts). Le plus grand défi était que les données des différentes années se trouvaient dans divers fichiers et semblaient toujours avoir une structure légèrement différente, les paramètres des suivis étant modifiés au fil des ans. Il fallait ainsi faire correspondre des variables qui décrivaient la même propriété, mais présentaient des appellations différentes ou un système de notation légèrement différent, ou encore identifier quelles variables n’avaient pas été enregistrées les années précédentes, mais qui l’étaient maintenant. Au total, nous avons pu « récupérer » les données de suivi portant sur 11 années, soit 4 230 relevés de plages et 1 120 observations de nids sur 77 plages différentes en Nouvelle-Écosse. Ces ensembles de données peuvent désormais être archivés sur Nature Counts, car ils présentent la même structure que les données qui y sont déjà regroupées. Cela signifie que tous et toutes pourront facilement utiliser ces données à long terme pour nous aider à mieux comprendre ces adorables petits oiseaux ! Stagiaire en sauvetage des données : Fiel Dimayacyac Mon stage de sauvetage de données portait sur les données climatiques récoltées par Parcs Canada dans les parcs nationaux du Nunavut et s’est effectué sous la direction de la chercheuse Florence Lapierre Poulin. Ces données ont été collectées de 1989 à 2019 dans les stations météorologiques du fjord Tanquary, du lac Hazen, de l’île Ward Hunt et de Conger. Elles ont été téléchargées chaque année, à chacun des emplacements, à partir des capteurs des stations météorologiques et ont été récemment fusionnées en une seule base de données par Florence. De nombreux scientifiques souhaitaient exploiter ces données, mais l’état de la base de données était problématique pour de multiples raisons. Ainsi, les méthodes de collecte de données variaient d’une année à l’autre, car les capteurs avaient été remplacés et améliorés au fil des ans. Différentes étiquettes existaient pour une même variable et il y avait des incohérences dans les unités de mesure ainsi que dans les intervalles de temps. Dans certains cas, les valeurs étaient erronées ou irréalistes pour diverses raisons (erreurs des capteurs). En raison de contraintes de temps, Florence avait besoin de l’aide d’un.e stagiaire en sauvetage de données pour le nettoyage, le formatage et la rationalisation des données afin que celles-ci puissent être facilement partagées sur le portail de données du gouvernement ouvert fédéral. Au cours de mon stage, j’ai accompli les tâches suivantes. J’ai d’abord séparé la base de données en fichiers CSV (valeurs séparées par des virgules) selon le type de données (lectures horaires ou quotidiennes) et l’emplacement (Tanquary, Hazen, etc.). Cela permettra aux chercheurs et aux chercheuses d’utiliser plus facilement les données dans un logiciel d’analyse, puisque la plupart des programmes n’acceptent pas les feuilles de calcul Excel comportant plusieurs onglets. Deuxièmement, une grande partie des données étaient séparées en tranches de temps, par exemple 1989-2007 et 2007-2013. J’ai donc fusionné ces ensembles de données selon leur type et leur emplacement afin que les données de chaque site d’échantillonnage soient regroupées en un seul CSV pour chacun des types de données. Ce processus impliquait l’agrégation de colonnes redondantes (répétées). Par exemple, à un même site, l’humidité relative avait été enregistrée par plusieurs capteurs, et nommée différemment d’un capteur à l’autre. Ce processus comprenait également la normalisation des horodatages entre les années et les lieux. Finalement, j’ai étudié la distribution des données de chaque année afin d’identifier les périodes où celles-ci semblaient erronées pour détecter s’il y avait eu des problèmes avec des capteurs ou certaines de leurs unités. Lorsque les données étaient manifestement incorrectes, j’ai recherché dans les fichiers bruts tout commentaire concernant ces périodes et j’ai identifié des problèmes de givrage des capteurs et de pannes de courant. Ces problèmes et bien d’autres ont été signalés par l’entremise de divers codes d’erreur. De plus, j’ai créé des fichiers de métadonnées séparés contenant les descriptions des différentes étiquettes, unités et interprétations, ainsi qu’une légende pour les codes d’erreur et le texte intégral de toutes les erreurs enregistrées. J’ai également créé un plan de gestion des données pour les futur.es gestionnaires de bases de données afin qu’iels puissent facilement télécharger de nouvelles données de manière ordonnée et facile à gérer. Stagiaire en sauvetage de données : Charlotte Hagelstam-Renshaw Le parc provincial Kawartha Highlands est situé dans le sud de l’Ontario, au Canada. Les Kawartha Highlands comprennent de nombreux petits lacs et zones humides et se trouvent à proximité de grandes villes, notamment Toronto (Ontario). Le parc constitue donc une destination populaire en été. Les visiteurs et visiteuses y profitent de nombreuses activités de plein air, comme le camping et le canoë. Il importe ainsi de faire le suivi de la santé de ses plans d’eau et de comprendre les effets potentiels de l’activité humaine sur ceux-ci. Trente-quatre lacs situés à l’intérieur ou à proximité du parc ont été échantillonnés par le laboratoire du professeur Paul Frost du Département de biologie de l’Université Trent, afin d’étudier l’évolution de la qualité de l’eau. Ces données sont utilisées pour évaluer les tendances actuelles et serviront de référence pour les années futures. Le but de ce projet Living Data était de formater et de combiner les ensembles de données sur la qualité de l’eau des lacs Kawartha de différentes années afin qu’ils puissent être rendus accessibles sur DataStream, une plateforme en ligne en libre accès qui permet de partager des données sur la santé des eaux douces au Canada. Au cours de ce projet, nous avons notamment dû nous assurer que les mesures d’une même variable utilisaient la même unité, uniformiser les différentes orthographes utilisées pour les lacs, et nous assurer que les ensembles de données étaient dans le format requis pour le téléchargement sur DataStream. Il a aussi fallu ajouter des colonnes spécifiant les instruments et les méthodes utilisés pour analyser les échantillons et générer des métadonnées. Ces données sont accessibles au https://doi.org/10.25976/s8fc-td24. Entre autres fonctionnalités utiles, DataStream permet de visualiser l’évolution de caractéristiques telles que le pH et les nutriments au fil du temps sur des graphiques et de visualiser les lieux d’échantillonnage sur une carte. Une meilleure compréhension des écosystèmes aquatiques du parc provincial Kawartha Highlands peut aider à atténuer les effets potentiels de l’activité humaine sur le paysage et les plans d’eau qui s’y trouvent, ainsi qu’à sensibiliser à l’importance environnementale de ces écosystèmes d’eau douce. Ce projet Living Data a été réalisé en partenariat avec la Fondation Gordon. Stagiaire en sauvetage de données : Janaina Serrano Les séries chronologiques à long terme de suivi de populations focales font partie des données les plus précieuses collectées par les écologistes, et leur préservation est essentielle à la compréhension des changements historiques et futurs dans la démographie et la dynamique des espèces sauvages. Depuis 1975, le professeur Peter Arcese et ses collègues font le suivi d’une population de Bruants chanteurs (Melospiza melodia) sur l’île Mandarte, dans le détroit de Haro, près de l’île de Vancouver, en Colombie-Britannique. Ces données ont été collectées de diverses manières par Frank S. Tompa 1960-63, James N. M. Smith 1973-81, Peter Arcese 1981-87, Wesley Hochachka 1988-89, Alice Cassidy 1990, ainsi que par Peter Arcese et divers étudiant.es, post-doctorant.es, et employé.es depuis 1991. Grâce à ce suivi intensif, Arcese et son équipe ont collecté plus de 40 ans de données démographiques, d’histoire de vie et de génétique/généalogie, ainsi que des informations détaillées sur l’emplacement de chaque oiseau depuis le départ du nid jusqu’à sa mort. Ces données ont été utilisées pour faire le pont entre la démographie et la théorie de l’évolution et pour répondre à plusieurs questions fondamentales. Les données climatiques correspondantes sont déjà disponibles en ligne, ce qui offre de nombreuses possibilités d’analyses futures. En plus de la surveillance à long terme de l’île Mandarte, les chercheurs et chercheuses ont également collecté des données similaires à court terme sur plus d’une douzaine d’autres îles. Ce stage visait à harmoniser différentes sources de données et incluait l’extraction de données à partir de documents papier et de fichiers non propriétaires, la numérisation, le nettoyage et la validation des données, ainsi que la génération de métadonnées. Le professeur Arcese prend sa retraite dans trois ans. Le projet Living Data souhaitait donc contribuer à rendre ces ensembles de données accessibles à un public scientifique plus large. L’objectif principal du projet Living Data – Les Bruants chanteurs de l’île Mandarte était de commencer à récupérer les données sur la survie des adultes pendant la saison de reproduction en commençant par les données plus récentes puisque la collecte de celles-ci était plus uniforme que celle des années 80 et 90. Janaina Serrano du labo Pollock de l’Université McGill était la stagiaire responsable de l’organisation et de la saisie des données de 2022 à 2005. Elle a fourni un plan de gestion des données et des métadonnées, ainsi qu’un guide pratique pour les autres personnes qui prendront part au projet à l’avenir. Janaina a effectué la majeure partie de son stage en ligne et a participé à plusieurs réunions Zoom avec Peter Arcese et Joey Burant, qui était le postdoctorant PLD affecté à ce projet. Pendant la dernière semaine d’août 2022, Janaina a eu l’occasion de découvrir l’île Mandarte guidée par Megan Duchesne et Tayse Bryce, qui y recherchaient des Bruants chanteurs. Iels ont réussi à en trouver, même si l’espèce subit actuellement un déclin sur l’île, et semble y faire face à la concurrence d’une autre espèce de bruant, le Bruant fauve. Références supplémentaires :
Stagiaire en sauvetage de données : Siobhan Schenk Les données à long terme portant sur la communauté intertidale des zones rocheuses à Discovery Bay, en Jamaïque, recueillies par le professeur Jurek Kolasa de l’University McMaster et ses nombreux étudiants et étudiantes chaque année de 1989 à 2006 sont uniques non seulement par la durée de l’étude et la richesse des microinvertébrés échantillonnés, mais également par les possibilités d’enrichissement culturel offertes aux personnes qui ont participé au projet. L’ensemble de données à long terme sur la communauté intertidale des zones rocheuses existe aujourd’hui grâce à un voyage de plaisance que le professeur Kolasa a effectué en Jamaïque après son embauche comme professeur adjoint à l’Université McMaster. Au cours de ses promenades, il constate la diversité des organismes locaux, ce qui le pousse à organiser un cours sur le terrain. Un an après son premier voyage, il revient avec le premier groupe estudiantin accompagné d’auxiliaires pédagogiques. Lui-même et un auxiliaire d’enseignement ont alors remarqué les bassins rocheux et y ont collecté quelques échantillons. La valeur des données s’est révélée évidente et, quelques années plus tard, le professeur Kolasa a obtenu un financement du CRSNG pour poursuivre l’étude de cette communauté écologique. Ces petites piscines rocheuses et les données qui y sont collectées sont vraiment uniques. Non seulement les études de suivi à long terme sont très rares en écologie, mais si l’on contextualise la durée temporelle de l’étude (1989 à 2006) à la réalité des organismes qui y vivent, cela équivaut à environ 500 générations de microinvertébrés dans les mares rocheuses ! De plus, en raison de la faible variation saisonnière dans la baie Discovery (tout le contraire de l’endroit où Jurek vit et travaille, soit à Hamilton, en Ontario), les tendances dans l’abondance des organismes sont clairement attribuables aux conditions de la piscine rocheuse, plutôt qu’à de larges variations saisonnières. Cette particularité a permis au professeur Kolasa d’étudier des questions théoriques sur les moteurs de la biodiversité, son principal intérêt de recherche. Les chercheuses et chercheurs jamaïcains de Marine Labs sont des leaders en matière de surveillance des récifs coralliens et de gestion des pêcheries dans la région. Grâce à leur travail, l’industrie y a réduit sa surpêche et un réseau de petites stations de recherche s’est mis en place dans toutes les Caraïbes. Ce riche environnement de recherche attire des étudiants et étudiantes du monde entier, non seulement pour la science unique qui se pratique à Marina Labs, mais également pour l’expérience culturelle. Grâce aux cours organisés par le professeur Kolasa, les étudiant.es de McMaster ont pu vivre à la station de recherche avec des étudiant.es de l’University of West Indies, et découvrir la riche culture jamaïcaine. Au cours de leurs voyages annuels en Jamaïque, le professeur Kolasa et ses étudiant.es ont vécu de nombreuses aventures, notamment assister à des concerts qui n’ont jamais eu lieu, trouver des paquets « inhabituels » sur le bord de la route et déguster des boissons locales (en dehors des heures de travail, bien sûr). Les échantillonnages annuels se sont poursuivis après 2006, mais ont dû être suspendus en raison de la pandémie de COVID-19. Nous espérons que les activités scientifiques et les aventures reprendront bientôt ! Stagiaire en sauvetage de données :
Ashton Sies Haida Gwaii est une région d’une extrême importance tant sur le plan culturel que biologique. Situé au large de la frontière nord-ouest de la Colombie-Britannique continentale, c’est la demeure du peuple haïda et de ses ancêtres depuis des temps immémoriaux. Pour en savoir plus sur l’histoire de la nation haïda, ainsi que sur sa gouvernance actuelle, cliquez ici (en anglais seulement). Au sud de Haida Gwaii, la réserve de parc national, la réserve d’aire marine de conservation et le site du patrimoine Haida Gwaii Haanas constituent une zone protégée et un écosystème côtier vierge. La Laskeek Bay Conservation Society (LBCS) a été fondée il y a plus de 30 ans afin de mieux comprendre et gérer[1] les écosystèmes de Haida Gwaii et de Gwaii Haanas, en particulier ceux de la région de la baie de Laskeek. Les efforts actuels de recherche et de suivi de la LBCS sont divers, allant du suivi des populations d’oiseaux marins à l’étude d’espèces introduites (par exemple, les cerfs, les ratons laveurs et les écureuils), en passant par le suivi écologique des plantes et des lichens rares. Plus d’informations sur ces recherches sont accessibles ici (en anglais), avec des détails plus précis sur chaque projet ici (en anglais également). [1] Les objectifs de la LBCS incluent notamment (traduction libre) : Étudier et suivre à long terme les populations fauniques des écosystèmes marins et terrestres de Haida Gwaii ; Offrir aux non-scientifiques, en particulier aux étudiant.es et aux résident.es locaux de Haida Gwaii, la possibilité de participer en tant que bénévoles à nos programmes sur le terrain ; Promouvoir la conservation des espèces indigènes et sensibiliser le public aux changements causés par les espèces introduites à Haida Gwaii. Une liste complète est accessible en anglais ici. Stagiaire en sauvetage de données :
Elizabeth Houghton Plus de 1 500 enregistrements hydrochimiques des plans d’eau de la Saskatchewan ont été collectés par le laboratoire de recherche sur les pêches de la Saskatchewan à Saskatoon entre 1920 et 1990. Chaque enregistrement était dactylographié et incluait jusqu’à 86 paramètres chimiques de l’eau. Les informations sur les emplacements où ces échantillons de qualité d’eau avaient été collectés se limitaient souvent à des coordonnées approximatives, des points de repère, ou une description juridique des terres concernées. Le laboratoire de recherche sur les pêches de la Saskatchewan a été fermé au début des années 1990 en raison d’un manque de financement, et ces documents papier ont été laissés dans des classeurs à l’unité des pêches du ministère de l’Environnement de la Saskatchewan. Ces enregistrements constituent une référence précieuse sur la qualité de l’eau dans un nombre inégalé de plans d’eau de la Saskatchewan. Stagiaire en sauvetage de données : Jory Griffith La station de recherche Trail Valley Creek est située 50 km au nord d’Inuvik, dans les Territoires du Nord-Ouest, au Canada. Trail Valley Creek est une zone extrêmement importante, car elle draine 58 km2 de toundra et repose sur un pergélisol continu. Cette région se réchauffe également plus rapidement que la majeure partie du globe. Ce réchauffement entraîne une fonte accrue du pergélisol, un verdissement de l’Arctique, une diminution des chutes de neige et des modifications du ruissellement. Ces changements ont d’importantes répercussions sur les ressources hydriques du Canada. La station de recherche de Trail Valley Creek collecte des données hydrologiques dans cette région depuis plus de 30 ans. |
Archives
October 2024
CatÉgories |