Collecteur générique pour tracer l'activité sur le web

Encadrant:Pierre-Antoine Champin (http://champin.net/)
Date: octobre 2012
Langages:Javascript

Résumé

L'objectif du projet est de développer un outil permettant de collecter des traces d'activités sur le web, afin d'assister l'internaute dans son utilisation d'applications web complexes.

Présentation du sujet

L’utilisation d’Internet est de plus en plus répandue et les outils disponibles (page web, site de commerce en ligne, blog, forum, wiki, etc.) ainsi que les supports (ordinateur, tablette, Smartphone, etc.) évoluent en permanence. Les possibilités sont infinies. Toutefois, certains outils sont parfois complexes à prendre en main.

À titre d’exemple, le web de données permet d’annoter le contenu des pages web afin d’avoir des informations sémantiques sur le contenu des pages. Ces informations peuvent ensuite être utilisées dans différents buts : recherche d’informations, proposition de ressources personnalisées, etc. Ces annotations sémantiques sont obtenues de différentes manières, et notamment via des interactions avec les utilisateurs du web.

Le but du projet tuteuré est de fournir un collecteur de traces générique pour les applications web. Nous entendons par générique le fait que ce collecteur pourra observer les utilisateurs d’application web quelque soit le type de l’application et le support de navigation. L’observation de utilisateur devra être assez fine pour permettre de rejouer à partir des traces les différentes actions de l’utilisateur lors de sa navigation. Afin de mettre en place de collecteur de traces, deux outils sont proposés.

Le premier est l’extension Greasemonkey pour le navigateur web Mozilla Firefox. Cette extension permet de modifier le comportement d'une page web en associant un script JavaScript au chargement de celle-ci. L’extension Greasemonkey est de plus utilisable avec d’autres navigateurs (Chrome, Opera, Internet Explorer, etc.).

Le second outil est le framework kTBS. Ce framework permet de stocker des traces d’interaction en définissant le modèle de celles-ci, c’est à dire en définissant les types d’informations contenues dans les traces. Une fois les traces stockées, le kTBS permet de faire des transformations sur ces traces : fusion de plusieurs traces, filtrage, requête SPARQL... Il est par exemple possible d’extraire des traces de navigation d’un utilisateur les actions faites sur une période donnée, puis de ne garder que les actions d’édition d’une page wiki.

Le travail demandé consiste à :