Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
stages:start [2018/10/29 14:09]
ecoquery [Reconnaissance automatisée de motifs dans des messages non structurés]
stages:start [2018/10/29 14:11] (Version actuelle)
ecoquery
Ligne 1: Ligne 1:
 ====== Sujets de stage / TER / POM ====== ====== Sujets de stage / TER / POM ======
  
-===== Interface Web pour gestionnaire de flux ===== 
- 
-L'équipe BD du LIRIS développe actuellement un système de recueil, simulation, stockage et rejeu de flux de données. 
-Un serveur d'administration permet de gérer le système via une interface REST. 
-L'objectif de ce POM consiste à développer un client Web pour ce serveur d'administration. 
-Après avoir développé une partie administrative classique, on s'attardera à développer des interfaces de visualisation des différentes métriques liées aux flux (volumétrie, vitesse) ou à la plateforme (e.g. IO/s, espace libre).  
-Le framework Angular sera privilégié pour le développement de cette interface. 
-L'acquisition des métriques côté serveur pourra également faire l'objet de développements particulier dans ce POM. 
-      
-===== Sauvegarde et rejeu de flux de données ===== 
- 
-L'équipe BD du LIRIS développe actuellement un système de recueil, simulation, stockage et rejeu de flux de données. 
-L'objectif de ce POM consiste à faire évoluer la brique de stockage de ce système. 
-Cette brique est actuellement implémentée en Scala, un langage fonctionnel compilant sur la JVM et utilise une base de données Cassandra pour le stockage des messages. 
-Les évolutions envisagées pour cette brique sont les suivantes: 
- 
-  * Mutualisation du déploiement de la brique de stockage pour plusieurs flux 
-  * Autodéploiement d'instances de briques de stockage pour faire face à une augmentation de débit sur un ou plusieurs flux 
-  * Changement "en ligne" (sans redémarrage) de la configuration d'un ou plusieurs flux 
-  * Réglage automatisé (auto-tuning) de la répartition des données au sein du cluster Cassandra 
-  * Mise en place un benchmark permettant de mesurer la performance de la plateforme sur un déploiement particulier 
- 
-Si le temps le permet, on pourra faire évoluer la brique de rejeu du système en la portant vers le langage RUST (elle est actuellement codée en Scala), ce qui permettrait de s'affranchir des aléas du ramasse-miettes (garbage collector) de la JVM. 
  
 ===== Prédiction de suites temporelles ===== ===== Prédiction de suites temporelles =====
Ligne 76: Ligne 53:
   * Aisance dans le workflow de contributions github   * Aisance dans le workflow de contributions github
   * Connaissance de syslog-ng est un plus   * Connaissance de syslog-ng est un plus
 +
 +
 +===== Interface Web pour gestionnaire de flux =====
 +
 +L'équipe BD du LIRIS développe actuellement un système de recueil, simulation, stockage et rejeu de flux de données.
 +Un serveur d'administration permet de gérer le système via une interface REST.
 +L'objectif de ce POM consiste à développer un client Web pour ce serveur d'administration.
 +Après avoir développé une partie administrative classique, on s'attardera à développer des interfaces de visualisation des différentes métriques liées aux flux (volumétrie, vitesse) ou à la plateforme (e.g. IO/s, espace libre). 
 +Le framework Angular sera privilégié pour le développement de cette interface.
 +L'acquisition des métriques côté serveur pourra également faire l'objet de développements particulier dans ce POM.
 +     
 +===== Sauvegarde et rejeu de flux de données =====
 +
 +L'équipe BD du LIRIS développe actuellement un système de recueil, simulation, stockage et rejeu de flux de données.
 +L'objectif de ce POM consiste à faire évoluer la brique de stockage de ce système.
 +Cette brique est actuellement implémentée en Scala, un langage fonctionnel compilant sur la JVM et utilise une base de données Cassandra pour le stockage des messages.
 +Les évolutions envisagées pour cette brique sont les suivantes:
 +
 +  * Mutualisation du déploiement de la brique de stockage pour plusieurs flux
 +  * Autodéploiement d'instances de briques de stockage pour faire face à une augmentation de débit sur un ou plusieurs flux
 +  * Changement "en ligne" (sans redémarrage) de la configuration d'un ou plusieurs flux
 +  * Réglage automatisé (auto-tuning) de la répartition des données au sein du cluster Cassandra
 +  * Mise en place un benchmark permettant de mesurer la performance de la plateforme sur un déploiement particulier
 +
 +Si le temps le permet, on pourra faire évoluer la brique de rejeu du système en la portant vers le langage RUST (elle est actuellement codée en Scala), ce qui permettrait de s'affranchir des aléas du ramasse-miettes (garbage collector) de la JVM.