Aller au contenu

Pourquoi un réseau SIST ?


Le réseau SIST a été créé originellement par des personnels des unités de recherche du CNRS Terre & Univers et des Observatoires des Sciences de l’Univers (OSU) en charge de la gestion des données d’observation.

Les services informatiques des unités de recherche du CNRS Terre & Univers et des OSU ont pour vocation et pour mission d’intervenir dans la gestion des données d’observation, de leurs produits dérivés, et des autres données nécessaires à l’interprétation.

  • La constitution du réseau technologique SIST favorise le partage et la diffusion de connaissances, et crée une dynamique qui permet d’améliorer l’accomplissement des projets scientifiques des tutelles en matière de gestion des données scientifiques

Les données d’observation sont des données résultant d’acquisitions pouvant être effectuées par des observateurs humains, mais le plus souvent issues d’instruments ou de capteurs positionnés au sol, sur/sous l’eau, ou encore embarqués à bord de navires, avions, ballons ou satellites.

Les actions informatiques liées à la gestion de ces données se situent à divers niveaux :

  • l’accompagnement de la définition des observateurs instrumentaux, de leur réalisation et de leur mise en œuvre (tests, étalonnages, intégration, contrôle) ;
  • l’acquisition des données ;
  • les transferts de données aux systèmes informatiques dédiés ;
  • la production des données à partir du flux issu des observateurs, sa transformation en grandeurs physiques interprétables avec les problématiques de validation et du défloutage ; 
  • la structuration et le stockage des données, incluant notamment le formatage des données, la création des métadonnées, l’usage de standards et la modélisation des bases de données ;
  • l’analyse, l’exploration, la correction et la qualification des données ;
  • la diffusion des données comprenant les aspects de disponibilité, de sélection, d’outils de manipulation, d’interprétation ou de visualisation, etc ;
  • la préservation et la sécurisation des informations : disponibilité, intégrité et confidentialité ;
  • la documentation et le référencement des données, notamment via la création et la diffusion de métadonnées, et l’attribution et la gestion d’identifiants uniques comme les DOI ;
  • la valorisation et la promotion des informations par des actions de compréhension des données et des outils (sites collaboratifs, ateliers, séminaires…) ;
  • la pérennisation des données pour les décennies à venir.

Une gestion correcte des données d’observation implique donc des compétences diverses que doivent acquérir les personnels concernés, concernant de multiples « métiers » en informatique :

  • administration systèmes et réseau,
  • développement d’applications,
  • création et administration de bases de données,
  • spécialisation liées aux types de données produites comme la géomatique, etc.

Par ailleurs, il est primordial d’aborder les problématiques de la standardisation des échanges et des solutions techniques permettant l’interopérabilité des données : 

  • d’une part, un certain nombre de directives (INSPIRE au niveau européen) et de normes nous poussent à assurer l’interopérabilité entre les données pour faciliter la diffusion, la disponibilité, l’utilisation et la réutilisation des informations. Nous avons donc une obligation de partage et de valorisation de la donnée. 
  • d’autre part, la mise en place des pôles de données (Aeris, Form@ter, Océan, Théia, Pôle National des Données de Biodiversité) et des Infrastructures de Recherche, ainsi que la participation à des programmes nationaux et internationaux (Observatoires Virtuels par exemple) requièrent de rendre nos systèmes interopérables quant à l’échange de données.

Dans ce contexte où les besoins et problématiques rencontrés par les gestionnaires de données sont relativement identiques et standards, il est nécessaire de partager et mutualiser les compétences acquises, d’identifier ces besoins, de les porter au niveau des tutelles et d’y répondre par un panel de solutions qui auront été testées, validées et mises en exploitation.

La constitution du réseau technologique SIST favorise le partage et la diffusion de connaissances, et crée une dynamique qui permet d’améliorer l’accomplissement des projets scientifiques des tutelles en matière de gestion des données scientifiques