Activités de recherche

 

Collaborations

Les recherches décrites ici ont été ou sont actuellement menées en étroite collaboration avec de nombreux co-auteurs. J'aimerais en particulier citer, par ordre alphabétique, les étudiants dont j'ai eu le plaisir :-) d'encadrer ou co-encadrer la thèse :

Axes de recherche

L'émergence de nouveaux médias et la mise en place d'infrastructures de communication haute performance (Internet, Intranets, réseaux locaux et métropolitains) confrontent aujourd'hui l'informatique des bases de données à une triple problématique : d'une part, l'explosion du volume des informations manipulées dans les grandes bases de données ; d'autre part, l'accroissement considérable des charges transactionnelles supportées par les serveurs de données ; enfin, la complexification des requêtes d'interrogation et des opérations mises en œuvre dans les serveurs. Dans ce cadre, nous nous intéressons plus spécifiquement à la conception et au développement de services d'information multimédias répartis collaboratifs. Nos travaux, après s'être focalisés sur le developpement de serveurs multimédias au-dessus d'architectures parallèles, s'orientent aujourd'hui vers la collaboration de serveurs (éventuellement implantés sur plate-forme parallèle) et la modélisation et le traitement de requêtes multimédias.

 

Un peu d'histoire... (à propos des systèmes de mémoire distribuée virtuellement partagée)

En parallèle avec nos travaux sur les services multimédias, nous avons, jusqu'à très récemment mené des recherches sur les environnements de programmation parallèle, plus particulièrement sur les systèmes de mémoire distribuée virtuellement partagée (MDVP) : La spécificité du système que nous avons developpé, DOSMOS, est double :

Quelques articles pour en savoir plus...

Ces travaux ont été réalisés dans le cadre des thèses de Laurent Lefèvre et d'Olivier Reymann. Laurent Lefèvre, désormais enseignant-chercheur à l'Université Claude Bernard-Lyon I, poursuit le développement de DOSMOS. Pour plus d'information...

Plus récemment, nous avons également développé une interface haute-performance Java pour clusters de PC interconnectés par Myrinet.

 

Bases de données et serveurs multimédias parallèles

Les architectures parallèles, en raison de leur extensibilité intrinsèque et du remarquable rapport performance/prix qu'elles affichent, apparaissent comme une solution matérielle particulièrement intéressante au problème de charge des serveurs que nous avons évoqué plus haut. En particulier, l'arrivée récente de nouvelles technologies d'interconnexion type Myrinet ou Giga Ethernet, via le développement de réseaux (également appelés grappes) de stations de travail /PC haute performance (faible latence, grande bande passante), ouvre la voie à un nouveau type de parallélisme à gros/moyen grain au coût relativement faible… à condition d'être en mesure de développer de nouvelles stratégies et heuristiques de gestion de données adaptées à ces architectures. Deux cibles applicatives nous ont plus particulièrement intéressés : les très grandes bases de données décisionnelles et les serveurs documentaires et multimédias. Les premières revêtent un intérêt grandissant en raison de la mise en place d'entrepôts de données agrégeant des volumes d'informations réparties considérables. Les seconds bénéficient directement du développement d'Internet, de la mise en place d'Intranets et de l'émergence très forte de nouveaux services multimédias (serveurs vidéo à la demande, archives audiovisuelles, édition vidéo, grands caches Web). Sur un plan fondamental, dans le cadre des applications évoquées ci-dessus, nos travaux ont essentiellement porté sur l'optimisation et le traitement de requêtes parallèles, sur la mise en place de mécanismes d'exécution répartie haute performance et de gestion de caches collaboratifs.

Dans un premier temps, nos travaux ont porté sur l'étude de mécanismes génériques de parallélisation de bases de données. Nous avons ainsi exhibé un nouveau formalisme de représentation de requêtes relationnelles parallèles, les graphes DPL , qui offre une très grande puissance de description, en particulier en permettant d'intégrer dans le scénario d'exécution des requêtes des informations d'ordonnancement et de placement. Fondé sur les graphes DPL, nous avons ainsi exhibé une nouvelle classe de scénarios d'exécution, les arbres denses sérialisés (serialized bushy trees) et de nouvelles heuristiques d'optimisation qui, expérimentalement, ont démontré qu'ils offraient des performances remarquables, en particulier en présence de limitations sur la disponibilité des ressources. Nous avons enfin formalisé le concept d'extension parallèle de serveur de données qui modélise le couplage d'un serveur d'application (typiquement un SGBD) et d'un réseau de stations/PC dans ses différentes composantes : duplication partielle des données, mécanismes de synchronisation, parallélisation des traitements, schémas de communication. Sur un plan applicatif, nous avons développé un optimiseur parallèle de requêtes relationnelles, MPO (Modular Parallel Optimizer) et un module d'extension parallèle pour SGBD relationnel au-dessus de Java, Enkidu que nous avons en particulier interfacé avec Oracle.

Ces différents travaux ont bénéficié du soutien d'un projet de transfert technologique européen, Esprit Technological Transfert Node et d'un projet financé par la Région Rhône-Alpes, Santé & HPC.

Quelques articles pour en savoir plus...

Parallèlement, nos recherches sur les serveurs multimédias ont essentiellement porté sur la conception et la mise en œuvre de serveurs vidéo parallèles dans le cadre d'applications d'archives audiovisuelles au sein du projet Sésame financé par France Telecom R & D. Notre approche a visé à intégrer les informations d'indexation disponibles (annotations des séquences audiovisuelles) au cœur des mécanismes et des heuristiques de gestion et de manipulation de données : ordonnancement des requêtes, politique de remplacement des caches, pré-chargement de séquences, gestion de flux vidéo. Les heuristiques proposées ont ainsi affiché des performances supérieures de l'ordre de 15 à 25% par rapport aux heuristiques classiques. Sur un plan applicatif, nous avons conçu et implémenté un serveur vidéo parallèle portable intégrant nos travaux théoriques, le serveur MINA.

Quelques articles pour en savoir plus...

 

Modélisation de requêtes multimédias - Requêtes par le contenu

Les systèmes de gestion de bases de données sont aujourd'hui confrontés à l'omniprésence du multimédia : images, vidéo, sons... Après nous être intéréssés au stockage et à l'accès de données vidéo (cf ci-dessus), nous nous intéréssons depuis1999 à la modélisation de données multimédias (images/meta données) et de requêtes fondées sur le contenu. Nous avons ainsi proposé une algèbre pour la représentation et le traitement de données images (images brutes + méta-données) impliquant des mesures de similarité entre images. Nous avons en particulier exhibé un certain nombre d'opérateurs (sélection multimédia, jointure multimédia, multi-jointure multimédia, opérateur "mine" (sélection inverse), etc.) dont nous avons étudié les propriétés. S'appuyant sur ce cadre formel, nous avons plus récemment proposé des heuristiques d'optimisation de requêtes mixtes relationnel-multimédia.

Quelques articles pour en savoir plus...

 

Services d'information multimédias répartis collaboratifs

L'émergence de réseaux d'interconnexion à haut-débit permet aujourd'hui d'envisager la mise en place de mécanismes de collaboration entre systèmes d'information distants délivrant le même service... à condition d'être en mesure de définir les protocoles de partage et d'échange de données adéquats. L'approche que nous proposons s'inspire d'une part des mécanismes de type proxy ; d'autre part, de nos travaux antérieurs sur la gestion sémantique de caches vidéo parallèles. Nous avons ainsi récemment proposé une architecture logicielle de collaboration fondée sur l'interconnexion de proxies agissant en aval des serveurs de données. Ces proxies indexent le contenu des documents (texte uniquement) et mettent ainsi à jour en temps réel la "carte des thématiques chaudes". L'analyse de cette carte leur permet d'une part d'optimiser leur politique de gestion de cache et de pré-chargement ; d'autre part d'optimiser la politique d'échange de documents inter-proxies ; enfin, de faire bénéficier l'utilisateur d'un véritable moteur d'indexation et de recherche à forte plus-value.

Les premières expérimentations, menées dans le cadre de systèmes d'archivage de données vidéo et de proxies Web sont particulièrement intéressants.

Quelques articles pour en savoir plus...

 

Publications

Publications en ligne

... ou qui vont bientôt l'être :-) :

Environnements de programmation parallèle - Mémoire distribuée virtuellement partagée - Java haute performance

L. Brunie, L. Lefèvre "New propositions to improve the scalability and the efficiency of distributed shared memory systems", IEEE ICA3PP'96 (International Conference on Algorithms And Applications of Parallel Computing), Singapour, juin 1996, p. 356-364.

L. Brunie, L. Lefèvre, O. Reymann "Execution analysis of DSM applications : a distributed and scalable approach", ACM SPDT'96 (Sigmetrics Symposium on Parallel and Distributed Tools), Philadelphie, mai 96, p. 51-60

L. Brunie, L. Lefèvre, O. Reymann "High Performance Distributed Objects for Cluster Computing", 1st IEEE International Workshop on Cluster Computing (IWCC '99)}, Melbourne, Australie, déc. 99 ; IEEE Computer Society Press, p. 229-236.

L. Brunie, M. Exbrayat, N. Gimmillaro "Combining Myrinet and Java in the context of a query evaluation application : first experiments and results", Myrinet User Group Conference, Lyon, France, septembre 2000.

Optimisation parallèles de requêtes relationnelles - Extension parallèle de SGBD relationnel

L. Brunie, H. Kosch "Control strategies for complex relational query processing in shared nothing systems", ACM Sigmod Records, vol. 25, n° 3, septembre 1996

L. Brunie, H. Kosch, W. Wohner "From the modeling of parallel relational query processing to the query optimization and simulation", Parallel Processing Letters, vol. 8, n° 1, mai 1998.

M. Exbrayat, L. Brunie, A PC-NOW Based Parallel Extension for a Sequential DBMS, PC-NOW 2000, Cancun, Mexique, mai 2000.

Serveurs vidéo parallèles

Mostefaoui, L. Brunie, H. Kosch, L. Boeszoermenyi, Multi-clip Query Optimization in Video Servers, IEEE International Conference on Multimedia and Expo. ICME'2000, New-York, juillet 2000

L. Brunie, H. Kosch, A. Mostefaoui, Semantic Based Prefetching in News-On-Demand Video Servers, Multimedia Tools and Applications Journal, éditions Kluwer ; accepté, à paraître.

A. Mostefaoui, C. Perez, L. Brunie, Serveur de séquences audiovisuelles parallèle sur réseau haut débit : concepts et expérimentations, Rencontres Francophones du Parallélisme, RENPAR'11, Rennes, juin 99, 127-132.

Services d'information répartis collaboratifs

Lionel Brunie, David Coquil, Serge Simon, Software architectures for collaborative proxies in wide area information systems (position paper), Fourth International Workshop on Parallel and Distributed Databases : innovative applications and new architectures (PaDD'2001), Münich, septembre 2001, IEEE Computer Society Press.

Lionel Brunie, David Coquil, Ahmed Mostefaoui, Semantic optimized heuristics for multimedia databases caching and prefetching, SPIE International Symposium on Voice, Video, and Data Communications Multimedia Networks and Management, Denver, Colorado, Etats-Unis, août 2001.

Modélisation de requête multimédia - Requêtes par le contenu - Bases de données d'images

Solomon ATNAFU, Lionel BRUNIE, and Harald KOSCH, Similarity-Based Algebra for Multimedia Databases, In the Proc. the 12th Australian Database Confrence (ADC'01), Gold Cost, Australia, Jan. 29 - Feb. 2, 2001, IEEE Computer Society Press, pp. 115-122.

S. Atnafu, L. Brunie, H. Kosch, Similarity-Based Operators and Query Optimization for Multimedia Database Systems, IDEAS'2001, Grenoble, juillet 2001 (zip format)