Ph.D Olivier CAVADENTI
Contribution de la découverte de motifs à l'analyse de collections de traces unitaires
Download Draft here
Defended on September 27th 2016 at INSA de Lyon
Committee
Pr. Jérôme AZE, Université de Montpellier, LIRMM, Rapporteur
Pr. François BRUCKER, Ecole Centrale de Marseille
Dr. Mehdi KAYTOUE, INSA Lyon, LIRIS,
co-directeur
Frédéric MENUT, Chef de Projet ACTEMIUM Saint-Etienne
Résumé. Dans le contexte manufacturier, un ensemble de produits sont acheminés entre différents sites avant d’être vendus à des clients finaux. Chaque site possède différentes fonctions : création, stockage, mise en vente, etc. Les données de traçabilités décrivent de manière riche (temps, position, type d’action,. . . ) les évènements de création, acheminement, décoration, etc. des produits. Cependant, de nombreuses anomalies peuvent survenir, comme le détournement de produits ou la contrefaçon d’articles par exemple. La découverte des contextes dans lesquels surviennent ces anomalies est un objectif central pour les filières industrielles concernées. Dans cette thèse, nous proposons un cadre méthodologique de valorisation des traces unitaires par l’utilisation de méthodes d’extraction de connaissances. Nous montrons comment la fouille de données appliquée à des traces transformées en des structures de données adéquates permet d’extraire des motifs intéressants caractéristiques de comportements fréquents. Nous démontrons que la connaissance a priori, celle des flux de produits prévus par les experts et structurée sous la forme d’un modèle de filière, est utile et efficace pour pouvoir classifier les traces unitaires comme déviantes ou non, et permettre d’extraire les contextes (fenêtre de temps, type de produits, sites suspects,. . . ) dans lesquels surviennent ces comportements anormaux. Nous proposons de plus une méthode originale pour détecter les acteurs de la chaîne logistique (distributeurs par exemple) qui auraient usurpé une identité (faux nom). Pour cela, nous utilisons la matrice de confusion de l’étape de classification des traces de comportement pour analyser les erreurs du classifieur. L’analyse formelle de concepts (AFC) permet ensuite de déterminer si des ensembles de traces appartiennent en réalité au même acteur.
Abstract. In
a manufacturing context, a product is moved through different
placements or sites before it reaches the final customer. Each of these
sites have different functions, e.g., creation, storage, retailing,
etc. In this scenario, traceability data describes in a rich way the
events a product undergoes in the whole supply chain (from factory to
consumer) by recording temporal and spatial information as well as
other important elements of description. Thus, traceability is an
important mechanism that allows discovering anomalies in a supply
chain, like diversion of computer equipment or counterfeits of luxury
items. In this thesis, we propose a methodological framework for mining
unitary traces using knowledge discovery methods. We show how the
process of data mining applied to unitary traces encoded in specific
data structures allows extracting interesting patterns that
characterize frequent behaviors. We demonstrate that domain knowledge,
that is the flow of products provided by experts and compiled in the
industry model, is useful and efficient for classifying unitary traces
as deviant or not. Moreover, we show how data mining techniques can be
used to provide a characterization for abnormal behaviours (When and
how did they occur ?).We also propose an original method for detecting
identity usurpations in the supply chain based on behavioral data,
e.g., distributors using fake
identities or concealing them. We
highlight how the knowledge discovery in databases, applied to unitary
traces encoded in specific data structures (with the help of expert
knowledge), allows extracting interesting patterns that characterize
frequent behaviors. Finally, we detail the achievements made within
this thesis with the development of a platform of traces analysis in
the form of a prototype.
Publications liées à la thèse
Olivier Cavadenti, Victor Codocedo, Mehdi Kaytoue and Jean-Francois Boulicaut. Identifying Avatar Aliases in StarCraft 2. Proceedings of the 2nd Workshop Machine Learning and Data Mining for Sport Analytics MLSA 2015 co-located with ECML PKDD 2015, Porto, Portugal, September 2015. Unpublished proceedings.