Métadonnées pour PAGODA
PAGoDA est une infrastructure calcul/stockage en développement au laboratoire LIRIS. Dans cette infrastructure, les chercheurs vont déployer des workflow de calcul qui vont utiliser et générer des données scientifiques. Ces données étant particulièrement précieuses pour le travail des chercheurs, il est important de pouvoir les cataloguer afin de pouvoir les préserver, les retrouver et les rendre accessibles. Cela nécessite que l’infrastructure de PAGoDA, et en particulier son serveur d’administration, soit capable de gérer des méta-données associées à ces données.
La plateforme PerSCiDO propose un modèle de méta-données RDF pour les jeux de données scientifiques. Ce modèle pourrait servir de point de départ pour celui de PAGoDA qui lui ajouterait des informations internes supplémentaires comme des références vers les volumes de stockages utilisés par la plateforme ou encore des informations concernant la politique de sauvegarde à appliquer à ces données.
L’objectif de ce projet OR consiste à proposer un modèle de méta-données pour PAGoDA et à prototyper un système permettant de gérer les métadonnées au sein du serveur d’administration de PAGoDA.
Technologies utilisées:
- Blazegraph ou Jena pour le stockage de données RDF et PostgreSQL pour le stockage de données relationnelles
- Go et le framework gin-gonic pour l’implémentation du serveur d’administration de PAGoDA
- Kubernetes est l’orchestrateur utilisé par PAGoDA