projet recherche 2003-2006

Projet de recherche 2003-2006 : gestion de données pour les systèmes pervasifs et les grilles de calcul

L’information numérique est partout. Les réseaux informatiques tissent leur toile dans l’ensemble des composants de notre vie professionnelle et, de plus en plus, personnelle (téléphones mobiles, assistants personnels, ordinateurs portables…) . Amener la bonne (l’utile) information au bon moment, à la bonne personne, dans le bon format : tel est l’un des enjeux cruciaux de la prochaine décade.

L’objet des recherches en informatique pervasive est précisément d’étudier cette problématique. La gestion des données en constitue clairement l’une des composantes-clefs, recouvrant de nombreux aspects : extensibilité du système, accès et intégration des données (en termes d’indexation et d’exécution de requêtes dans un environnement distribué fortement hétérogène), optimisation de l’utilisation des ressources et de la qualité de service (bande passante réduite, discontinuité du service), cohérence de l’information (l’utilisateur pouvant se trouver en mode déconnecté, comment assurer la cohérence et la pérennité d’une donnée ?), adaptation des contenus au contexte d’utilisation et au profil de l’utilisateur.

Un autre enjeu important pour la recherche en informatique est la mise en place d’infrastructures de gestion et de traitement de données à grande échelle. En effet, la masse des données disponibles dans les grands systèmes d'information est devenue aujourd’hui considérable. Les capteurs de nature diverse (images médicales, physique particulaire, concentration de polluants, astrophysique), mais aussi les simulateurs complexes (météorologie, climatologie, physique nucléaire,...) produisent des quantités de données pouvant aller au-delà d’un péta-octets ! Manipuler de tels volumes exige de disposer d’une puissance de calcul considérable et de mettre en place des systèmes de gestion de données spécifiques. Depuis quelques années, plusieurs initiatives de mise en commun de ressources informatiques ont ainsi émergé, en vue de constituer des "grilles de calcul" ou des "méta-ordinateurs": des machines connectées à travers Internet (ou un réseau spécialisé) sont intégrées dans un espace virtuel de calcul (et de stockage) disponible de manière transparente pour les utilisateurs de cette grille. Peu d'outils de manipulation de données (indexation, recherche, sécurité/confidentialité) ont cependant été jusqu'alors développés. Les recherches se sont en effet plutôt attachées à l'aspect calcul et services disponibles sur ces grilles.

Bien que de natures différentes, ces deux enjeux scientifiques et technologiques se recoupent sur un certain nombre de problématiques : optimisation des ressources disponibles, hétérogénéité des plates-formes, utilisation d’une technologie middleware de transfert d’information, indexation, ou du moins référencement, des données, extensibilité des solutions, confidentialité des données… Les récentes propositions de convergence entre intergiciels (middlewares) de grille et services Web (OGSA (Open Grid Services Architecture (projet Globus)), OGSI (Open Grid Service Infrastructure ; Global Grid Forum)) vont clairement dans cette direction.

Dans ce contexte, notre volonté est double :

- Le cœur de notre démarche est de fonder nos formalismes et nos protocoles sur la typologie et la sémantique d'utilisation des informations manipulées. Nos travaux récents sur les architectures logicielles de proxies, les protocoles d'échange de données confidentielles, les outils d'archivage d'images ou de séquences audiovisuelles, … font tous appel à la connaissance préalable ou monitorée des modes d'utilisation des données. Les expérimentations et les prototypes que nous avons développés ces trois dernières années montrent l'efficacité qualitative (fonctionnalités offertes) et quantitative (performances système) de cette approche. Sur un plan conceptuel, nous entendons donc poursuivre cette démarche sur les thèmes déjà lancés, en particulier sur la confidentialité (autour de la délégation de droits) et sur la mise en œuvre de proxies "intelligents" adaptés aux grilles de calcul (proxies gérant outre des données, des index, des procédures d'adaptation de données, des mécanismes d'intégration et de réplication de données…). Prolongeant ces travaux, nous démarrons également actuellement une collaboration avec le groupe du LIRIS travaillant sur les entrepôts de données autour de la mise en place d'entrepôts de données médicales sur une grille. Enfin, nous venons de lancer un travail de thèse en convention CIFRE (partenariat : société Aricie) sur la mise en place de mécanismes et protocoles de gestion économique d'une grille de données ;

- Sur un plan applicatif, nous comptons intégrer une partie des travaux réalisés dans le cadre de nos deux cibles applicatives principales : les grilles médicales et les bases de données d'images réparties pervasives. Il s'agira en particulier d'intégrer nos mécanismes de gestion de la confidentialité et nos outils de recherche d'information par le contenu avec d'une part les protocoles d'adaptation de données pervasives ; d'autre part, les structures de partage de bases d'images médicales sur une grille. Cette intégration nécessitera un travail conceptuel important et des développements logiciels significatifs.