stages
Les stages en sauvetage de données sont un moyen de réunir des dépositaires de données avec des étudiants ou étudiantes aux cycles supérieurs hautement qualifiés qui travailleront à ranger, documenter et archiver des ensembles de données prioritaires pour le Canada.
-
QU’EST-CE QUE LE SAUVETAGE DES DONNÉES ?
-
POUR LES STAGIAIRES
-
POUR LES PROPRIÉTAIRES DE DONNÉES
<
>
Le sauvetage des données permet l’identification, la préservation et le partage de données précieuses, et des métadonnées associées, qui risquent d’être perdues¹. Pour les dépositaires de données, ce stage fournit une main-d’œuvre qualifiée pour archiver des données importantes qui peuvent potentiellement être perdues en raison d’une conservation inadéquate. Ces données peuvent ainsi contribuer à l’écosystème de données ouvertes au Canada. Pour les stagiaires, il s’agit d’une occasion de renforcer leurs compétences en gestion de données, d’entrer en contact avec des chercheurs, chercheuses et organisations de partout au Canada, de pratiquer la science ouverte dans un cadre professionnel et d’aider à insuffler une nouvelle vie aux données patrimoniales.
¹ Pour en savoir plus sur le processus de sauvetage des données, consultez notre article (en anglais) : https://ecoevorxiv.org/ra6ze/
¹ Pour en savoir plus sur le processus de sauvetage des données, consultez notre article (en anglais) : https://ecoevorxiv.org/ra6ze/
Avantages pour les stagiaires
Une bourse de 6500 $ est accordée pour 6 semaines de stage à temps plein (ou l’équivalent à temps partiel réparti sur une période plus longue, soit 240 heures au total). Cette bourse est destinée à contribuer aux revenus de la personne stagiaire, et comprend tous avantages ou coûts.
Ce stage répond partiellement aux exigences du Certificat de l’ICEE en gestion des données et recherche reproductible. Le ou la stagiaire sera encouragée à développer des questions de recherche qui pourraient être testées à l’aide des ensembles de données en question et, le cas échéant, à poursuivre l’analyse et la publication de cette recherche.
Possibilité de postuler à des stages
Les candidat.es au stage doivent être aux études supérieures dans l’une des quatre universités suivantes : Université McGill, University of British Columbia (Vancouver ou Okanagan), Université de Montréal ou University of Regina. Le principal domaine de recherche des personnes candidates doit être l’écologie, l’évolution ou les sciences de l’environnement, et elles doivent démontrer qu’elles possèdent la formation conceptuelle nécessaire pour évaluer la valeur écologique des données rencontrées dans le projet. Les personnes candidates doivent être capables de créer des scripts informatiques pour gérer des données numériques, y compris pour les valider, compiler et en contrôler la qualité. Elles doivent aussi avoir l’expertise scientifique pertinente pour créer les métadonnées appropriées. Le ou la candidate doit être enthousiaste à l’idée de préserver les données patrimoniales et démontrer un engagement envers la science ouverte.
Une bourse de 6500 $ est accordée pour 6 semaines de stage à temps plein (ou l’équivalent à temps partiel réparti sur une période plus longue, soit 240 heures au total). Cette bourse est destinée à contribuer aux revenus de la personne stagiaire, et comprend tous avantages ou coûts.
Ce stage répond partiellement aux exigences du Certificat de l’ICEE en gestion des données et recherche reproductible. Le ou la stagiaire sera encouragée à développer des questions de recherche qui pourraient être testées à l’aide des ensembles de données en question et, le cas échéant, à poursuivre l’analyse et la publication de cette recherche.
Possibilité de postuler à des stages
Les candidat.es au stage doivent être aux études supérieures dans l’une des quatre universités suivantes : Université McGill, University of British Columbia (Vancouver ou Okanagan), Université de Montréal ou University of Regina. Le principal domaine de recherche des personnes candidates doit être l’écologie, l’évolution ou les sciences de l’environnement, et elles doivent démontrer qu’elles possèdent la formation conceptuelle nécessaire pour évaluer la valeur écologique des données rencontrées dans le projet. Les personnes candidates doivent être capables de créer des scripts informatiques pour gérer des données numériques, y compris pour les valider, compiler et en contrôler la qualité. Elles doivent aussi avoir l’expertise scientifique pertinente pour créer les métadonnées appropriées. Le ou la candidate doit être enthousiaste à l’idée de préserver les données patrimoniales et démontrer un engagement envers la science ouverte.
CRITÈRES POUR LES BASES DE DONNÉES PATRIMONIALES
1. La base de données comprend des données biologiques pertinentes pour l'écologie, l'évolution ou les sciences de l'environnement. Les données n'ont pas à être entièrement biologiques, les données physiques et chimiques sont acceptables si elles concernent un processus écologique ou évolutif. Par exemple, la chimie de l'eau est un élément important de la compréhension de l'écologie aquatique.
2. La base de données doit être importante d'une des manières suivantes : (1) extensive dans l'espace ou dans le temps (par exemple, relevés d'oiseaux sur plus d'une décennie, ou relevés nationaux de la densité de caribous); (2) décrivant une étude révolutionnaire dans l'histoire des sciences; (3) concernant une espèce ou un écosystème qui est considéré en péril au Canada, ou de grande valeur culturelle ou sociétale.
3. La priorité sera accordée aux ensembles de données qui concernent une espèce ou un écosystème du Canada ou qui ont été recueillis par un ou une chercheuse canadienne ou une organisation canadienne.
4. Le ou la propriétaire de la base de données s'engage à ce que les données soient archivées en permanence, ouvertes et accessibles. Nous sommes conscients que certaines personnes propriétaires de base de données peuvent avoir besoin de retarder temporairement la publication de leurs données, et dans de tels cas, nous pouvons envisager un embargo à court terme.
Nous proposons également une série de vidéos à nos partenaires de données. Celle-ci fournit plus d'informations sur ce qu'implique un stage de sauvetage de données et sur la façon dont vous devez vous préparer à en organiser un. Les vidéos sont accessibles ici ou sur la chaîne YouTube du projet Living Data.
1. La base de données comprend des données biologiques pertinentes pour l'écologie, l'évolution ou les sciences de l'environnement. Les données n'ont pas à être entièrement biologiques, les données physiques et chimiques sont acceptables si elles concernent un processus écologique ou évolutif. Par exemple, la chimie de l'eau est un élément important de la compréhension de l'écologie aquatique.
2. La base de données doit être importante d'une des manières suivantes : (1) extensive dans l'espace ou dans le temps (par exemple, relevés d'oiseaux sur plus d'une décennie, ou relevés nationaux de la densité de caribous); (2) décrivant une étude révolutionnaire dans l'histoire des sciences; (3) concernant une espèce ou un écosystème qui est considéré en péril au Canada, ou de grande valeur culturelle ou sociétale.
3. La priorité sera accordée aux ensembles de données qui concernent une espèce ou un écosystème du Canada ou qui ont été recueillis par un ou une chercheuse canadienne ou une organisation canadienne.
4. Le ou la propriétaire de la base de données s'engage à ce que les données soient archivées en permanence, ouvertes et accessibles. Nous sommes conscients que certaines personnes propriétaires de base de données peuvent avoir besoin de retarder temporairement la publication de leurs données, et dans de tels cas, nous pouvons envisager un embargo à court terme.
Nous proposons également une série de vidéos à nos partenaires de données. Celle-ci fournit plus d'informations sur ce qu'implique un stage de sauvetage de données et sur la façon dont vous devez vous préparer à en organiser un. Les vidéos sont accessibles ici ou sur la chaîne YouTube du projet Living Data.
QUESTIONS ET RÉPONSES SUR LE PROJET LIVING DATA
1. Le Projet Living Data met-il en place son propre référentiel?
Non. Il existe maintenant un grand nombre d'excellents référentiels de données qui ont été créés par des ministères, des bibliothèques universitaires, des centres de synthèse, des organisations à but non lucratif et des consortiums internationaux. Nous travaillerons avec vous pour choisir le référentiel qui correspond le mieux à votre base de données – ce sont vos données, et vous pouvez décider de leur lieu d’archivage tant que le référentiel répond à nos critères d'archivage numérique à long terme. Nous réalisons également que certains employeurs (par exemple, le gouvernement canadien) imposent des référentiels précis.
2. Que faire si le ou la propriétaire des données n'est plus en vie ou si les données appartenaient à une organisation disparue?
Aucun problème. Dans ce cas, le ou la stagiaire effectuera de nombreuses analyses de données, reconstituant la signification de chaque variable en recoupant avec d'autres sources ou en interviewant des chercheurs et chercheuses actifs.
3. Si je rends mes données publiques, est-ce des personnes les utiliseront mal parce qu'elles n’en comprennent pas le contexte?
L'utilisation abusive des données est une préoccupation valable, mais nous avons un outil important pour le combattre : les métadonnées. Votre stagiaire et vous élaborerez des descriptions détaillées (métadonnées) de chacune des variables de l'ensemble de données afin d'en expliquer adéquatement la complexité. De plus, nous avons la possibilité de créer des variables supplémentaires qui décrivent l’hétérogénéité dans la qualité des données ou dans le contexte. L'objectif est de fournir suffisamment d'informations sur les données pour qu'aucune autre explication ne soit nécessaire pour les utiliser.
4. Je ne peux pas rendre mes données publiques, car j'ai encore des publications prévues.
Ce n'est pas parce que vos données sont archivées que vous ne pouvez pas publier d'articles les mettant à profit. En fait, de nombreuses revues exigent maintenant que les données soient correctement archivées avant d'accepter un manuscrit pour publication. Vous pouvez également craindre qu'une autre chercheuse ne vous « scoop » avec vos propres données. Mais cela tient plus de la peur que la réalité. En fait, ce qui se produit généralement est un accroissement du nombre d'invitations à des collaborations que vous recevrez.
5. Si je rends mes données publiques, ne vais-je pas perdre tous les efforts investis dans leur collecte?
Pas nécessairement. Vous pouvez décider du type de licence ouverte Creative Commons associée à votre base de données archivée. Si vous choisissez une licence CCBY, les futures personnes utilisatrices doivent vous reconnaitre en tant que collecteur ou collectrice de données.
6. J'ai déjà prévu de transmettre mes données à un ou une collègue plus jeune, je n'ai donc pas besoin de les archiver.
C’est formidable que vous ayez trouvé une ou un tel collègue. Cependant, il serait beaucoup plus utile de transmettre cette base de données si elle était déjà correctement documentée, validée, organisée et archivée – sinon, votre collègue devra le faire sans votre précieuse contribution ou, pire encore, abandonnera. Nous serions ravis de travailler avec vous et votre collègue pour concevoir votre projet d'archivage de données afin qu'il réponde à la fois à vos besoins et à ceux de la communauté scientifique.
7. Si mes données sont dans [programme de base de données X], ne sont-elles pas déjà archivées?
Malheureusement non. Si votre base de données ne se trouve pas dans un référentiel de données sous la forme d’un fichier de lecture simple (.csv ou .txt – par exemple), elle n'est pas à l'épreuve du temps. Toutes les données contenues dans un logiciel propriétaire peuvent devenir illisibles si ce logiciel n'est plus pris en charge par la compagnie ou si la compagnie cesse d'exister. Vous vous souvenez des fichiers Lotus 1-2-3 que vous aviez auparavant? Bonne chance pour les ouvrir.
8. Que vais-je en retirer?
Un héritage durable pour votre carrière de recherche et la satisfaction de savoir que vos données continueront de servir les générations futures de scientifiques. Un résumé de votre carrière honorant vos réalisations et l'importance de votre ensemble de données sera également affiché sur le site Web de l’ICEE – Projet Living Data.
Non. Il existe maintenant un grand nombre d'excellents référentiels de données qui ont été créés par des ministères, des bibliothèques universitaires, des centres de synthèse, des organisations à but non lucratif et des consortiums internationaux. Nous travaillerons avec vous pour choisir le référentiel qui correspond le mieux à votre base de données – ce sont vos données, et vous pouvez décider de leur lieu d’archivage tant que le référentiel répond à nos critères d'archivage numérique à long terme. Nous réalisons également que certains employeurs (par exemple, le gouvernement canadien) imposent des référentiels précis.
2. Que faire si le ou la propriétaire des données n'est plus en vie ou si les données appartenaient à une organisation disparue?
Aucun problème. Dans ce cas, le ou la stagiaire effectuera de nombreuses analyses de données, reconstituant la signification de chaque variable en recoupant avec d'autres sources ou en interviewant des chercheurs et chercheuses actifs.
3. Si je rends mes données publiques, est-ce des personnes les utiliseront mal parce qu'elles n’en comprennent pas le contexte?
L'utilisation abusive des données est une préoccupation valable, mais nous avons un outil important pour le combattre : les métadonnées. Votre stagiaire et vous élaborerez des descriptions détaillées (métadonnées) de chacune des variables de l'ensemble de données afin d'en expliquer adéquatement la complexité. De plus, nous avons la possibilité de créer des variables supplémentaires qui décrivent l’hétérogénéité dans la qualité des données ou dans le contexte. L'objectif est de fournir suffisamment d'informations sur les données pour qu'aucune autre explication ne soit nécessaire pour les utiliser.
4. Je ne peux pas rendre mes données publiques, car j'ai encore des publications prévues.
Ce n'est pas parce que vos données sont archivées que vous ne pouvez pas publier d'articles les mettant à profit. En fait, de nombreuses revues exigent maintenant que les données soient correctement archivées avant d'accepter un manuscrit pour publication. Vous pouvez également craindre qu'une autre chercheuse ne vous « scoop » avec vos propres données. Mais cela tient plus de la peur que la réalité. En fait, ce qui se produit généralement est un accroissement du nombre d'invitations à des collaborations que vous recevrez.
5. Si je rends mes données publiques, ne vais-je pas perdre tous les efforts investis dans leur collecte?
Pas nécessairement. Vous pouvez décider du type de licence ouverte Creative Commons associée à votre base de données archivée. Si vous choisissez une licence CCBY, les futures personnes utilisatrices doivent vous reconnaitre en tant que collecteur ou collectrice de données.
6. J'ai déjà prévu de transmettre mes données à un ou une collègue plus jeune, je n'ai donc pas besoin de les archiver.
C’est formidable que vous ayez trouvé une ou un tel collègue. Cependant, il serait beaucoup plus utile de transmettre cette base de données si elle était déjà correctement documentée, validée, organisée et archivée – sinon, votre collègue devra le faire sans votre précieuse contribution ou, pire encore, abandonnera. Nous serions ravis de travailler avec vous et votre collègue pour concevoir votre projet d'archivage de données afin qu'il réponde à la fois à vos besoins et à ceux de la communauté scientifique.
7. Si mes données sont dans [programme de base de données X], ne sont-elles pas déjà archivées?
Malheureusement non. Si votre base de données ne se trouve pas dans un référentiel de données sous la forme d’un fichier de lecture simple (.csv ou .txt – par exemple), elle n'est pas à l'épreuve du temps. Toutes les données contenues dans un logiciel propriétaire peuvent devenir illisibles si ce logiciel n'est plus pris en charge par la compagnie ou si la compagnie cesse d'exister. Vous vous souvenez des fichiers Lotus 1-2-3 que vous aviez auparavant? Bonne chance pour les ouvrir.
8. Que vais-je en retirer?
Un héritage durable pour votre carrière de recherche et la satisfaction de savoir que vos données continueront de servir les générations futures de scientifiques. Un résumé de votre carrière honorant vos réalisations et l'importance de votre ensemble de données sera également affiché sur le site Web de l’ICEE – Projet Living Data.