A la découverte des collections de PACEA

Environnement

Il est aujourd’hui possible de consulter les données des collections du laboratoire PACEA (CNRS, université de Bordeaux, Ministère de la culture). Ce projet, à l’initiative du laboratoire, est piloté par l’ingénieur de recherche Arnaud Caillo qui travaille depuis trois ans sur un plan de gestion global des données de la recherche du laboratoire. Objectif : conserver les données scientifiques sur le long terme du fait de la « non reproductibilité » des échantillons archéologiques et les valoriser en les rendant accessible au plus grand nombre.

Le plan de gestion des données du laboratoire PACEA

 

Les chercheurs du laboratoire PACEA s’intéressent à l’histoire biologique, culturelle et symbolique des populations du passé en relation avec les changements environnementaux depuis l’origine du genre Homo jusqu’à un passé très récent. Ils sont amenés à étudier des collections archéologiques constituées d’outils en pierre taillée ou autres matériaux, objets de parure, fossiles, échantillons géologiques et ont bâti à l’appui de ces recherches d’importantes collections de référence constituées d’échantillons actuels.

Ces dernières années, le partage des données de science est devenu un enjeu de taille au cœur des problématiques du monde de la recherche. Ainsi, depuis trois ans maintenant, l’ingénieur de recherche Arnaud Caillo travaille sur un plan de gestion des données écoresponsable pour le laboratoire PACEA (CNRS, université de Bordeaux, Ministère de la culture), en concertation étroite avec Anne Delagnes, directrice d’unité et responsable du site web des collections et avec les chercheurs et ingénieurs en charge de ces collections. Ce concept permet d’avoir une vue d’ensemble de tous les services à mettre en place pour ouvrir les données de la recherche, c’est ce que l’on s’appelle l’Open Science.

Pour aider au mieux les scientifiques dans cette démarche, Arnaud Caillo propose des formations et un accompagnement personnalisé. La création d’une base de données doit permettre aux chercheurs d’assurer la pérennité de leurs travaux et de partager leurs recherches selon des protocoles définis. En effet, l’ouverture des données dans le monde de la recherche est un enjeu majeur, l’une des raisons étant que ces données sont le plus souvent non reproductibles. Par exemple les os fossiles, humains ou non-humains constituent des spécimens uniques en matière d’informations à l’échelle des individus (âge, état de santé, régime alimentaire, etc.) et des populations (identité biologique) auxquels ils appartiennent et sont donc non reproductibles. Les chercheurs se doivent de documenter correctement ces spécimens et de les préserver en vue de possibles recherches ultérieures. Cet exemple met en évidence l’importance de la métadonnée (caractéristique normalisée et structurée utilisée pour la description et le traitement d’une ressource). Dans le cas des données archéologiques et paléontologiques, qui sont bien souvent issues d’échantillons d’os, de pierre ou de sédiment, la connaissance des contextes (géolocalisation, chronologie, bio- et géo-environnement, etc.) liés à leur découverte est essentielle à leur étude. Les nombreuses données issues de la recherche, comme les représentations 3D, sont elles-mêmes vulnérables à défaut de solutions de stockage pérennes.

Le plan de gestion des données répond à ces problématiques en englobant la collecte des données sur le terrain, leur enrichissement à l’aide de métadonnées, leur archivage sur le long terme et enfin leur accessibilité. Il se décline en huit phases : la planification, la collecte, la documentation, l’analyse, le stockage, la conservation, l’exposition des données numériques et leur réutilisation.

C’est en cherchant à répondre à ces problématiques qu’est né le projet d’exposition des données des collections PACEA avec le soutien de l’Institut de l’Information Scientifique et Technique du CNRS (INIST). Ce sont presque dix personnes avec des compétences différentes et complémentaires qui ont travaillé sur ce projet au sein de l’INIST. Cette unité d’appui à la recherche propose de développer des bases de données et des portails web d’accès aux données sous le CMS OMEKA pour les laboratoires du CNRS.    

Découvrez les collections de PACEA

 

Ce portail web, né de la collaboration entre le laboratoire PACEA (CNRS, université de Bordeaux, Ministère de la culture) et l’INIST, est opérationnel depuis la fin du mois d’octobre 2021. Il permet l’accès aux données des échantillons du laboratoire PACEA. A ce jour, on compte 70 jeux de données identifiées dont 14 collections.

Le site est accessible au grand public. Actuellement, les visiteurs pourront découvrir la collection « Anatomie comparée - Les animaux non-humains » sur laquelle ont travaillé trois chercheurs du laboratoire PACEA : Arnaud Lenoble, Véronique Laroulandie et Jean-Baptiste Mallye. C’est la première collection à avoir été mise en ligne via ce portail. Elle concerne cinq sous-collections :

  • Avitek (collection ostéologique aviaire),
  • Crustatek (collection de crustacés),
  • Herpetotek (collection ostéologique de squamates et amphibiens),
  • Mammatek (collection ostéologique de mammifères),
  • Piscitek (collection ostéologique de poissons).

Il est ainsi possible de connaître les données de 3000 échantillons comme leur nom, leur famille, leur genre, leur lieu de stockage, etc.

D’autres collections sont en cours de mise en ligne. L’objectif étant de valoriser les 13 autres collections du laboratoire sur le site web comme par exemple les spécimens fossiles humains, la collection l’anatomie comparée humaine ou encore les collections lithiques, etc.

© CNRS Aquitaine - Service communication

Un projet écoresponsable

En créant ce site, l’équipe projet du portail web PACEA avait à cœur d’être écoresponsable. Pour avoir un système d’information propre, il faut tenir compte des 115 bonnes pratiques d’éco-conception (Collectif GreenIt) lors de l’élaboration des systèmes d’information. Toutes les pratiques ne peuvent pas forcement être mises en place facilement, comme héberger son site chez un hébergeur qui utilise une énergie verte. Toutefois, toutes celles qui pouvaient être mises en place l’ont été. A titre d’exemple, aucune fonctionnalité non strictement nécessaire n’a été conçue.

Le portail web proposé par PACEA est donc un site simple, didactique et qui répond parfaitement aux besoins de l’utilisateur.

Et après ?

Les équipes du laboratoire PACEA (CNRS, université de Bordeaux, Ministère de la culture) continuent de travailler sur le déploiement de ce Plan de Gestion de Données pour le rendre totalement opérationnel et autonome.

Sur le moyen terme, pour la phase de collecte de données de ce plan de gestion de données, l’objectif est de créer un projet pour le déploiement d’un système d’information mobile et autonome pour la production de données directement sur le terrain.  Ce système intégrera des technologies spécifiques comme un serveur web et bases de données sur Raspberry Pi (alimenté par une énergie propre de faible consommation), connecté en Wifi à des outils d’acquisition de données comme des drones ou des tablettes embarquant des applications dédiées à la saisie de données archéologiques. Ces technologies répondraient aux objectifs de la réutilisation et de l’interopérabilité des données. En effet, les informations seraient tout de suite structurées et enregistrées dans le serveur de base de données du Raspberry Pi, synchronisé avec un serveur centralisé en retour de mission.

Enfin, Arnaud Caillo et ses collaborateurs ont à cœur de continuer à défendre l’OpenScience et l’accompagnement des communautés scientifiques. Arnaud Caillo est déjà impliqué dans différents projets comme Code SHS (Contribuer à l’Ouverture des Données en SHS). Il fait également parti du comité de pilotage de DoRANum (Données de la Recherche : Apprentissage Numérique), plateforme de formation mise en place en 2017 par l’INIST et le GIS Réseau des Urfist, permettant la création de ressources pour accompagner la communauté scientifique dans la gestion et le partage de leurs données. 

 

En savoir plus

Pour découvrir le site des collections du laboratoire PACEA, cliquez ici

Pour aller sur le site de PACEA, cliquez ici