Cette initiative inscrite dans le deuxième Plan national pour la science ouverte met en en valeur des jeunes chercheurs, des projets et des équipes de recherche qui œuvrent à la gestion et à la diffusion et pour certains d’entre eux appuient leurs travaux de recherche sur la réutilisation des données déjà disponibles.
Les prix se déclinent en trois catégories :
- "réutilisation des données" récompense deux jeunes chercheurs conduisant des projets de recherche en utilisant des données déjà disponibles et en rendant les données qu’ils produisent réutilisables ;
- "créer les conditions de la réutilisation" récompense trois équipes conduisant un travail exemplaire de gestion des données de recherche afin de les rendre réutilisables ;
- mention spéciale du jury récompense deux projets exemplaires en termes d’ouverture ou de partage des données.
Les prix ont été remis le 29 novembre 2023 lors de la cérémonie des prix science ouverte, édition 2023.
Catégorie "réutilisation de données" – prix jeunes chercheurs
Alix Chagué et Thibault Clérice
Alix Chagué (doctorante, équipe ALMAnaCH, Inria Paris & CRIHN, Université de Montréal) & Thibault Clérice (starting research position, équipe ALMAnaCH, Inria Paris). Leur projet HTR-United est un catalogue permettant le partage et la découverte de données d’entrainement pour la transcription et la segmentation automatique de documents, dont les manuscrits. Ce projet met à disposition de nombreux supports avec des jeux variés de données d’entrainement, mais également les codes et modèles validés (Machine Learning pour la reconnaissance de texte) résultant de l’entrainement sur ces mêmes jeux de données. Il favorise la reconnaissance et la réutilisation de ces données répondant à tous les principes FAIR (Facile à trouver, Accessible, Interopérable, Réutilisable).
Charlotte Duvette
Cheffe du projet Richelieu et chercheuse associée au centre de recherche HiCSA (Histoire culturelle et sociale de l'art), a soutenu sa thèse en janvier 2022 à l’Université Paris 1 Panthéon-Sorbonne. Son projet « Richelieu- Histoire du quartier » étudie le patrimoine matériel et immatériel d’un quartier parisien au XIXe siècle à travers ses représentations iconographiques et son évolution parcellaire. La démarche est basée sur l’utilisation d’outils libres (base SQL, site, API) et le standard interopérable IIIF pour centraliser des ressources produites par différentes bibliothèques numériques. Ce projet répond aux problématiques liées aux données ouvertes propres à deux domaines : la recherche en histoire et en humanités numériques. Charlotte Duvette est par ailleurs membre du consortium Huma-num Projets Time Machines depuis 2023
Catégorie "créer les conditions de la réutilisation"
Projet « HMBD - Human Multiple Births Database »
Le projet « HMBD - Human Multiple Births Database » appartient au domaine des sciences humaines et sociales. C’est une base de données internationale sur les naissances multiples qui fournit des statistiques sur le nombre de naissances de jumeaux, de triplets, quadruplets et plus. L’objectif est de répondre à des enjeux de santé publique et de mieux comprendre les variations de naissance gémellaire selon les pays.
Ce projet a fait l’objet d’un financement ANR et est proposé par une équipe de 3 personnes : Catalina Torre post-doctorante au Muséum national d’Histoire naturelle, Arianna Caporali, ingénieure de recherche à l’Institut national d’études démographiques et Gilles Pison, porteur du projet et professeur au Muséum national d’Histoire naturelle et à l’Institut national d’études démographiques.
Projet « DataSusFood : Structurer et ouvrir les Données pour améliorer la Durabilité des Systèmes Alimentaires »
Le projet « DataSusFood : Structurer et ouvrir les Données pour améliorer la Durabilité des Systèmes Alimentaires » appartient au domaine de recherche Chimie et procédés. Ce projet a pour objectif de développer un écosystème interopérable d’outils en s'appuyant sur des ontologies d'ingénierie des aliments et des bioproduits pour des systèmes agroalimentaires plus durables. Ce projet met à disposition des données ouvertes via l'intégration des données à l'aide du web sémantique, en accord avec les principes FAIR (Facile à trouver, Accessible, Interopérable, Réutilisable).
Ce projet a fait l’objet de nombreux financement depuis 2014 par les départements de recherche d’INRAE et plus récemment par l’ANR dans le cadre d’un appel à projet science ouverte. Ce projet est porté par une équipe multidisciplinaire de 27 personnes et a été déposé par Magalie Weber, actuellement ingénieure en technologie de l’information et de la communication à INRAE.
Projet « Reconstituer les voyages interinsulaires passés dans le Pacifique grâce à la géochimie »
Le projet « Reconstituer les voyages interinsulaires passés dans le Pacifique grâce à la géochimie » appartient au domaine des sciences humaines et sociales. Ce projet est une base de données de composition géochimique et de renseignements contextuels. Ces données sont utilisées comme une source archéologique pour générer des cartographies et reconstituer les déplacements des populations des îles du Pacifique. La méthodologie développée permet d’adapter cette pratique à d’autres zones géographiques.
Ce projet est porté par Aymeric Hermann, chercheur au sein de l’UMR Technologie et Ethnologie des Mondes PréhistoriqueS – TEMPS (CNRS/Université Panthéon-Sorbonne/Université Paris Nanterre), avec la contribution de Robert Forkel, ingénieur au Max Planck Institute for Evolutionary Anthropology.
Catégorie "mention spéciale du jury"
Projet « EHDS: Enquête Handicap et destinées sociales »
Le projet « EHDS : Enquête Handicap et destinées sociales » appartient au domaine des sciences humaines et sociales. Ce projet réunit des données quantitatives et qualitatives sur les inégalités socio-économiques liées au handicap. A ces données s’ajoute une réflexion personnelle de la porteuse de projet sur la méthodologie d’auto-dépôt de données en sciences humaines et sociales. La documentation de ce travail permet une reproductibilité de la démarche d’auto-dépôt avec une approche vertueuse.
Ce projet qui a été réalisé grâce à la contribution de 8 personnes (Professeurs, directeurs de recherche, bibliothécaires, ingénieurs d’étude et de recherche) de l’Institut d’Études Politiques de Paris (Sciences Po Paris). Ce projet a été mené dans le cadre de la thèse de Célia Bouchet, porteuse du projet, qui a généré les données et réalisé leur auto-dépôt.
Projet « SHIP : Engagement de l'hippocampe dans la mémoire et la perception : Le rôle du contenu représentationnel »
Le projet « SHIP : Engagement de l'hippocampe dans la mémoire et la perception : Le rôle du contenu représentationnel » appartient au domaine de recherche en Biologie-Santé. Ce projet rassemble différentes pratiques encouragées dans une démarche de science ouverte avec la rédaction d’un « registered-report » dont l’un des objectifs est de répliquer des résultats publiés et de rendre accessible l’ensemble des données et matériels pour une réutilisation par la communauté scientifique.
Ce projet a été mené par une équipe de 5 personnes (doctorant, professeur des université, médecin neurologue, ingénieures d’étude et de recherche) du Laboratoire De Psychologie Et Neurocognition de l’Université de Savoie Mont Blanc. Le projet a été déposé par Jérémy Gardette, doctorant au début du projet.
Jury
Le jury du prix science ouverte des données de la recherche édition 2023, présidé par Anne Laurent (Professeur en informatique et directrice de l’Institut de Sciences des données de l’université de Montpellier) était composé de :
- M. Aboudarham Jean (CNRS/Observatoire de Paris)
- Mme Archambeau Anne-Sophie (IRD)
- M. Bonnet Pascal (CIRAD)
- Mme Chambodut Aude (Université de Strasbourg)
- M. Cottinet Thomas (Ministère de la transition écologique)
- M. Coudert François-Xavier (CNRS/Institut de recherche en chimie Paris)
- Mme Monjour Servanne (Sorbonne Universités/CELLF)
- M. Quesneville Hadi (INRAE)
- M. Roesch Etienne (University of Reading)
- M. Simon Chane Camille (ENSEA)