Extraction de concepts formels dans des données denses et bruitées

L'extraction de concepts formels (éventuellement sous contraintes) a fait d'importants progrès. Nous y avons participé avec, entre autres, la proposition de l'algorithme D-Miner [1]. En étant motivé par la sémantique particulièrement intéressante des concepts formels dans des données codant des propriétés (booléennes) d'expression de gènes pour des situations biologiques variées, nous avons étudié les limites de ces approches dans des données bruitées (explosion du nombre de concepts). Après une introduction à l'algorithme D-Miner et ses usages dans nos projets d'analyse du transcriptome, nous présenterons les différentes solutions étudiées pour travailler dans des contextes bruités (i.e., typiquement le cas de données transcriptome). Nous verrons deux stratégies basées sur le post-traitement de collections de concepts formels extraites [2,3] ainsi que notre dernière proposition pour l'extraction de concepts tolérants aux exceptions [4].

[1] J. Besson, C. Robardet, J-F. Boulicaut. Constraint-based mining of formal concepts in transactional data. In: Proceedings PaKDD_04, Sydney (Australia), May 26-28, 2004. Springer-Verlag LNCS 3056, pp. 615-624.

[2] C. Robardet, R. Pensa, J. Besson, J-F. Boulicaut. Using classification and visualization on pattern databases for gene expression data analysis. Proceedings PaRMa'04 co-located with EDBT 2004, Heraclion - Crete, Greece, March 18, 2004. CEUR Workshop Proceedings Vol. 16, pp. 107-118.

[3] J. Besson, C. Robardet, J-F. Boulicaut. Mining formal concepts with a bounded number of exceptions from transactional data. Post-workshop proceedings Knowledge Discovery in Inductive Databases KDID'04, Springer-Verlag LNCS volume 3377, pp. 33-45.

[4] J. Besson, C. Robardet, J-F. Boulicaut. Approximation de collections de concepts formels par des bi-ensembles denses et pertinents. Accepté à CAp 2005.