Ceci est une ancienne révision du document !


Sujets de stage / TER / POM

Framework pour expérimentations sur les performances des systèmes BigData

L'objectif de ce projet est de mettre en place un environnement facilitant la réalisation d'expériences sur les systèmes de gestion de données distribués utilisés dans le cadre du BigData. Cela comprend la possibilité de déployer des systèmes comme des distributions Hadoop, Cassandra, PostgreSQL XL, Elasticsearch, etc facilement en ayant besoin de saisir un minimum de paramètres. Cela comprend également le développement d'un système de récupération des logs et des mesures de performances lors des expérimentations, ainsi que la mise en place d'outils d'analyse (e.g. tableaux de bord, connection avec l'outil R, etc). Enfin une procédure de simplification chargement de données dans les différents systèmes sera développée. La plateforme IaaS visée pour les déploiements est openstack.

Mots-clé: BigData, devops, expérimentation
Type: développement, administration

Workflow de traitement de données

L'objectif de ce projet est d'évaluer la facilité de mise en place et d'utilisation de différents outils de gestion des flux de données et de traitement comme des ETL type Talend ou Pentaho ou des outils de workflow comme Knime. L'évaluation se fera avec comme objectif de pouvoir facilement chaîner des traitements sur les données dans le cadre d'expérimentations sur les données au LIRIS.

Mots-clé: workflow, traitement de donnée
Type: évaluation de solutions