Curriculum

Fabien Duchateau
Enseignant-chercheur (MCF)

Bureau :Nautibus 12.057 Téléphone :04 72 44 58 25 Courriel :prénom.nom [at] univ-lyon1.fr Adresse : Bâtiment Nautibus
Campus de la Doua
8, Bd Niels Bohr
69622 Villeurbanne Cedex
France

Fabien Duchateau, 2011

Depuis septembre 2011, je suis maître de conférences à l'Université Claude Bernard Lyon 1 pour l'enseignement et au LIRIS pour la partie recherche, dans l'équipe Base de Données.

En 2010, j'ai été sélectionné pour un contrat postdoctoral de 18 mois financé par l'institut de recherche européen ERCIM. La première partie de ce postdoc s'est effectuée au CWI, Pays-Bas, sous la supervision de Lynda Hardman. Ensuite, j'ai rejoint l'équipe de Trond Aalberg à NTNU, Norvège.

En novembre 2009, j'ai obtenu mon doctorat en informatique au LIRMM, Université de Montpellier (fac de sciences), France. Ma directrice de thèse est Zohra Bellahsène. Mon mémoire de thèse de doctorat s'intitule 'une approche générique pour la sélection d'outils de découverte de correspondances entre schémas'.

Mes principaux domaines de recherche sont l'intégration de données, l'appariement de schémas, d'ontologies et d'entités, le web sémantique et l'apprentissage appliqués principalement aux systèmes d'informations géographiques et aux bibliothèques numériques.

Vous pouvez télécharger mon CV détaillé (actualisé en 2020).

Enseignement

Les unités d'enseignement suivantes sont détaillées sur le site du département informatique de l'UCBL.

Recherche

Publications

  1. Detecting Conflicts and Recommending Actions for Urban Planning
    Regional Knowledge workshop, 2020
    Franck Favetta and Fabien Duchateau

    @TECHREPORT{regknow20,
      author = {Franck Favetta and Fabien Duchateau},
      title = {Detecting Conflicts and Recommending Actions for Urban Planning},
      type = {Regional Knowledge workshop},
      institution = {Laboratoire LIRIS},
      url = {http://www.laet.science/EUROPEAN-BRAINSTORM-WORKSHOP-ON},
      year = {2020},
    }

Voir mes publications sur HAL, DBLP ou ORCID.

Projets

Nom Financement Dates Partenaires Description
HiLLabex IMU2017-2020CMW, Home in Love, GRePSSystème de recommandation avec visualisation spatiale et non spatiale pour la recherche immobilière
DIRICKSPICS2015-2017NTNUIntégration, gardiennage et exploration de données culturelles sous forme de flux
MODALSPHC2015NTNUAlignement de connaissances: aspects distribués et passage à l'échelle
SYRTISANRT2014-2017ProgiloneCollaboration industrielle avec thèse CIFRE 'enrichissement sémantique d'entités culturelles'
UNIMAPLabex IMU2013-2016EVS, Rhône-Alpes TourismeIntégration de services géo-localisés issus de plusieurs fournisseurs en vue d’obtenir une carte unifiée - Application aux points d’intérêts (POI) touristiques
KOGARPHC2013NTNUGestion de connaissances dans le web des données
GDISBQR UCBL2013Gestion de la dynamicité et intégration sémantique dans un réseau de connaissances sur l’héritage culturel
AdnoscoLIRIS2012-2013Gestion des données personnelles
FORUMANR2006-2009CEMAGREF, IRISA, LIRIS, LIRMM, LIMOSConception d'un système médiateur sémantique pour des applications gérant de grands volumes de données

Prototypes

  • Logo GeoAlign
    GeoAlign

    Un outil d'appariement spatial entre Geonames, Here, OpenStreetMap et Bing Maps

    Les points d'intérêt (POI) sont cruciaux dans de nombreuses applications, par exemple touristiques, de recherche d'itinéraires ou de gestion de crise. Les fournisseurs cartographiques représentent traditionnellement ces POI au moyen d'une entité spatiale. Cependant,, la description de ces entités peut varier de façon significative d'un fournisseur à un autre (e.g., propriétés manquantes, informations obsolètes, valeurs incohérentes). L'appariement d'entités spatiales a pour objectif la détection de correspondances entre entités représentant le même POI. La plupart des approches existantes utilisent une fonction de combinaison de mesures de similarité qui est fixe, ce qui limite grandement sa configuration. De plus, l'évaluation de la qualité obtenue par ces approches d'appariement d'entités spatiales est une tâche difficile à cause de l'absence d'un jeu de données expertisé pour toutes les entités de tous les fournisseurs. GeoAlign est une application qui permet une configuration poussée lors de l'appariement de données spatiales entre Geonames, Here, OpenStreetMap et Bing Maps. Elle est également utile pour estimer la qualité des correspondances en se basant sur les caractéristiques des fonctions de combinaison et pour visualiser cette estimation en termes de vrais et faux positifs. Plus de détails sur la page dédiée à GeoAlign.

    1. Spatial Entity Matching with GeoAlign
      International Conference on Advances in Geographic Information Systems (SIGSPATIAL), 2019
      Nelly Barret and Fabien Duchateau and Franck Favetta and Ludovic Moncla

      @INPROCEEDINGS{sigspatial19demo,
        author = {Nelly Barret and Fabien Duchateau and Franck Favetta and Ludovic Moncla},
        title = {Spatial Entity Matching with GeoAlign},
        year = {2019},
        booktitle = {International Conference on Advances in Geographic Information Systems (SIGSPATIAL)},
        pages = {580–583},
        publisher = {ACM},
        ee = {http://dx.doi.org/10.1145/3347146.3359345},
      }

  • Logo VizLIRIS
    VizLIRIS

    Un outil de recommandation de quartiers

    Le choix d'unquartier est primordial lors d'un achat ou d'une location immobilière. Or, il est fréquent de ne pas connaître la ville où l'on arrive (e.g., mutation professionnelle) et la sélection d'un quartier pertinent devient alors un véritable défi. VizLIRIS facilite la comparaison entre quartiers en exploitant plusieurs centaines d'indicateurs INSEE pour différencier les quartiers. Une dizaine d'algorithmes d'apprentissage (K-means, SVM, Spectral Clustering, etc.) permettent soit de recommander un quartier (à partir de quartiers initiaux dans une autre ville), soit de regrouper des quartiers similaires dans une zone géographique donnée. Plus de détails sur la page dédiée à VizLIRIS.

    1. À la recherche du quartier idéal
      Extraction et Gestion des Connaissances (EGC), 2019
      Nelly Barret and Fabien Duchateau and Franck Favetta and Maryvonne Miquel and Aurélien Gentil and Loïc Bonneval

      @INPROCEEDINGS{egc19-demo,
        author = {Nelly Barret and Fabien Duchateau and Franck Favetta and Maryvonne Miquel and Aurélien Gentil and Loïc Bonneval},
        title = {À la recherche du quartier idéal},
        url = {http://editions-rnti.fr/?inprocid1002526},
        year = {2019},
        booktitle = {Extraction et Gestion des Connaissances (EGC)},
        pages = {429–432},
      }

    2. Étude des quartiers : défis et pistes de recherche
      Extraction et Gestion des Connaissances (EGC) - atelier DAHLIA, 2019
      Loïc Bonneval and Fabien Duchateau and Franck Favetta and Aurélien Gentil and Mohamed Nader Jelassi and Maryvonne Miquel and Ludovic Moncla

      @INPROCEEDINGS{egc19-dahlia,
        author = {Loïc Bonneval and Fabien Duchateau and Franck Favetta and Aurélien Gentil and Mohamed Nader Jelassi and Maryvonne Miquel and Ludovic Moncla},
        title = {Étude des quartiers : défis et pistes de recherche},
        url = {http://dahlia.egc.asso.fr/atelierDAHLIA-EGC2020.html},
        year = {2019},
        booktitle = {Extraction et Gestion des Connaissances (EGC) - atelier DAHLIA},
      }

  • Logo BIB-R
    BIB-R

    Un benchmark pour l'évaluation des outils d'interprétation de notices bibliographiques (FRBRisation)

    BIB-R est un benchmark (banc d'essai, i.e., jeux de données et métriques d'évaluation) pour l'interprétation des enregistrements bibliographiques. Il inclut deux jeux de données (T42 et BIB-RCAT) dédiés à l'évaluation du processus de FRBRisation (transformation des enregistrements en MARC vers FRBR). L'objectif de T42 est d'identifier les points forts et faiblesses d'un outil de FRBRisation en testant tous les problèmes qui peuvent survenir durant le processus. Le second jeu de données BIB-RCAT est extrait de plusieurs catalogues d'institutions culturelles et peut être utilisé pour comparer ou expérimenter un outil avec une qualité de données similaire à celles de catalogues réels. Les collections FRBR attendues (résultat expertisé) sont inclus dans BIB-R pour permettre une évaluation automatique. Les données d'entrée sont au format MARC/XML tandis que les collections FRBR sont disponibles en RDF/XML. Plus de détails sur la page dédiée à BIB-R.

    1. Open Datasets for Evaluating the Interpretation of Bibliographic Records
      Joint Conference on Digital Libraries (JCDL), 2016
      Decourselle, Joffrey and Duchateau, Fabien and Aalberg, Trond and Takhirov, Naimdjon and Lumineau, Nicolas

      @INPROCEEDINGS{jcdl2016poster,
        author = {Decourselle, Joffrey and Duchateau, Fabien and Aalberg, Trond and Takhirov, Naimdjon and Lumineau, Nicolas},
        title = {Open Datasets for Evaluating the Interpretation of Bibliographic Records},
        url = {http://doi.acm.org/10.1145/2910896.2925457},
        year = {2016},
        booktitle = {Joint Conference on Digital Libraries (JCDL)},
        pages = {253–254},
        publisher = {ACM},
        doi = {10.1145/2910896.2925457},
        keywords = {dataset, frbr, frbrization, migration, record interpretation},
        series = {JCDL '16},
        isbn = {978-1-4503-4229-2},
        location = {Newark, New Jersey, USA},
        numpages = {2},
        address = {New York, NY, USA},
      }

    2. BIB-R: A Benchmark for the Interpretation of Bibliographic Records
      Theory and Practice of Digital Libraries (TPDL), 2016
      Joffrey Decourselle and Fabien Duchateau and Trond Aalberg and Naimdjon Takhirov and Nicolas Lumineau

      @INPROCEEDINGS{tpdl16,
        author = {Joffrey Decourselle and Fabien Duchateau and Trond Aalberg and Naimdjon Takhirov and Nicolas Lumineau},
        title = {BIB-R: A Benchmark for the Interpretation of Bibliographic Records},
        url = {http://dx.doi.org/10.1007/978-3-319-43997-6_13},
        year = {2016},
        booktitle = {Theory and Practice of Digital Libraries (TPDL)},
        pages = {163–174},
        doi = {10.1007/978-3-319-43997-6_13},
      }

  • Logo GeoBench
    GeoBench

    Un outil d'intégration spatiale, pour générer un benchmark pour l'appariement d'entités spatiales ou pour construire une carte avec des informations complètes sur ses lieux favoris

    GeoBench est une application web qui facilite la création d'un benchmark (jeu de données) pour l'appariement d'entités spatiales. Sa fonctionnalité principale est de rechercher des points d'intérêt (e.g., restautants, hôtels) chez différents fournisseurs cartographiques (actuellement Geonames, Here et Google Maps) et de suggérer les entités correspondantes. L'interface facilite la validation de ces correspondances et permet de préciser le type de différences entre les valeurs d'attributs correspondants. Hormis la construction d'un jeu de données expertisé, GeoBench implémente aussi la fusion d'entités correspondances en une seule, ce qui permet aux utilisateurs de générer une carte personnalisée avec des informations complètes et cohérentes sur leurs lieux préférés. Plus de détails sur la page dédiée à GeoBench.

    1. GeoBench: a Geospatial Integration Tool for Building a Spatial Entity Matching Benchmark
      International Conference on Advances in Geographic Information Systems (SIGSPATIAL), 2014
      Anthony Morana and Thomas Morel and Bilal Berjawi and Fabien Duchateau

      @INPROCEEDINGS{sigspatial14demo,
        author = {Anthony Morana and Thomas Morel and Bilal Berjawi and Fabien Duchateau},
        title = {GeoBench: a Geospatial Integration Tool for Building a Spatial Entity Matching Benchmark},
        year = {2014},
        booktitle = {International Conference on Advances in Geographic Information Systems (SIGSPATIAL)},
        pages = {533-536},
        publisher = {ACM},
        ee = {http://dx.doi.org/10.1145/2666310.2666362},
      }

    2. PABench: Designing a Taxonomy and Implementing a Benchmark for Spatial Entity Matching
      International Conference on Advanced Geographic Information Systems, Applications, and Services (GEOProcessing), 2015
      Bilal Berjawi and Fabien Duchateau and Franck Favetta and Maryvonne Miquel and Robert Laurini

      @INPROCEEDINGS{geoprocessing15,
        author = {Bilal Berjawi and Fabien Duchateau and Franck Favetta and Maryvonne Miquel and Robert Laurini},
        title = {PABench: Designing a Taxonomy and Implementing a Benchmark for Spatial Entity Matching},
        url = {http://perso.liris.cnrs.fr/publis/?id7017},
        year = {2015},
        booktitle = {International Conference on Advanced Geographic Information Systems, Applications, and Services (GEOProcessing)},
        pages = {7-16},
        month = {feb},
        isbn = {978-1-61208-048-2},
        language = {en},
      }

    3. Detection, Integration and Correction Methods for Homologous Geographic Objects
      Communication IMU ALPHA, 2013
      Bilal Berjawi and Franck Favetta and Fabien Duchateau and Maryvonne Miquel and Robert Laurini

      @TECHREPORT{IMU-alpha13,
        author = {Bilal Berjawi and Franck Favetta and Fabien Duchateau and Maryvonne Miquel and Robert Laurini},
        title = {Detection, Integration and Correction Methods for Homologous Geographic Objects},
        type = {Communication IMU ALPHA},
        institution = {Laboratoire LIRIS},
        url = {http://imualpha.hypotheses.org/99},
        year = {2013},
      }

  • Logo KIEV
    KIEV

    Un outil d'extraction de relations binaires dans des documents textuels

    KIEV (aussi appelé SPIDER) a pour objectif l'extraction de relations binaires à partir de documents textuels afin de peupler des triplestores (RDF) ou des bases de connaissances. Il combine une partie sémantique (extension des libellés, regroupement de termes fréquents) avec des techniques de traitement automatique du langage (Part Of Speech tagging) pour générer des motifs pertinents pour un type spécifique de relation. Trois cas d'utilisation sont présentés : le premier permet la détection du ou des types de relation entre deux entités données (e.g., relation 'parodie' entre les entités 'lord of the rings' et 'bored of the rings'). Le second s'intéresse à la découverte d'entités objet à partir d'une entité sujet et d'un type de relation (e.g., objet 'lord of the rings' pour 'bored of the rings' + 'parody'). Enfin, le dernier cas d'utilisation fournit des exemples (paires d'entités) qui satisfont un type de relation donné. Plus de détails sur la page dédiée à KIEV.

    1. KIEV: a Tool for Extracting Semantic Relations from the World Wide Web
      International Conference on Extending Database Technology (EDBT), 2014
      Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg and Ingeborg Solvberg

      @INPROCEEDINGS{edbt14demo,
        author = {Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg and Ingeborg Solvberg},
        title = {KIEV: a Tool for Extracting Semantic Relations from the World Wide Web},
        year = {2014},
        booktitle = {International Conference on Extending Database Technology (EDBT)},
        pages = {632-635},
        publisher = {OpenProceedings.org},
        ee = {http://dx.doi.org/10.5441/002/edbt.2014.61},
      }

    2. An Integrated Approach for Large-Scale Relation Extraction from the Web
      Asia-Pacific Web Conference (APWeb), 2013
      Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg and Ingeborg Solvberg

      @INPROCEEDINGS{DBLP:conf/apweb/TakhirovDAS13,
        author = {Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg and Ingeborg Solvberg},
        title = {An Integrated Approach for Large-Scale Relation Extraction from the Web},
        url = {http://dx.doi.org/10.1007/978-3-642-37401-2_18},
        year = {2013},
        booktitle = {Asia-Pacific Web Conference (APWeb)},
        pages = {163-175},
        publisher = {Springer},
        ee = {http://dx.doi.org/10.1007/978-3-642-37401-2_18},
      }

    3. An Evidence-based Verification Approach to Extract Entities for Knowledge Base Population
      International Semantic Web Conference (ISWC), 2012
      Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg

      @INPROCEEDINGS{iswc12,
        author = {Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg},
        title = {An Evidence-based Verification Approach to Extract Entities for Knowledge Base Population},
        url = {http://dx.doi.org/10.1007/978-3-642-35176-1_36},
        year = {2012},
        booktitle = {International Semantic Web Conference (ISWC)},
        pages = {575-590},
        publisher = {Springer},
      }

  • Logo Repérage
    Repérage

    Un outil de repérage urbain à travers la prise de points de repère

    Le projet 'questions de repérage' a pour but d'analyser comment une personne se repère en ville. En utilisant l'interface web, un.e utilisateur.ice peut produire une carte personnalisée, représentant ses quartiers favoris et les éléments géographiques qui l'aident à s'y localiser.

    1. Outil de repérage urbain à travers la prise de points de repère
      Prototype, 2013
      Bilal Berjawi and Maxime Colomb and Thierry Joliveau and Franck Favetta and Fabien Duchateau and Maryvonne Miquel

      @TECHREPORT{dev-EVS-LIRIS13,
        author = {Bilal Berjawi and Maxime Colomb and Thierry Joliveau and Franck Favetta and Fabien Duchateau and Maryvonne Miquel},
        title = {Outil de repérage urbain à travers la prise de points de repère},
        type = {Prototype},
        institution = {Laboratoires EVS et LIRIS},
        year = {2013},
      }

    2. Detection, Integration and Correction Methods for Homologous Geographic Objects
      Communication IMU ALPHA, 2013
      Bilal Berjawi and Franck Favetta and Fabien Duchateau and Maryvonne Miquel and Robert Laurini

      @TECHREPORT{IMU-alpha13,
        author = {Bilal Berjawi and Franck Favetta and Fabien Duchateau and Maryvonne Miquel and Robert Laurini},
        title = {Detection, Integration and Correction Methods for Homologous Geographic Objects},
        type = {Communication IMU ALPHA},
        institution = {Laboratoire LIRIS},
        url = {http://imualpha.hypotheses.org/99},
        year = {2013},
      }

  • Logo FRBRpedia
    FRBRpedia

    Un plugin pour convertir un produit vendu sur le web selon le modèle FRBR et en connectant ses entités au Linked Open Data cloud (LOD)

    FRBRpedia est un plugin pour FRBRiser des produits du web, c'st à dire de les transformer selon le modèle FRBR. Cela implique la détection des entités Work (oeuvre), Agents (e.g., personne auteure, traductrice, illustratrice), Expression et Manifestation à partir des informations du produit. De plus, FRBRpedia essaie d'enrichir les entités extraites en les reliant au Linked Open Data (LOD). Le plugin supporte uniquement des produits Amazon et un enrichissement vers DBpedia. Plus de détails sur la page dédiée à FRBRpedia.

    1. FRBRPedia: a Tool for FRBRizing Web Products and Linking FRBR Entities to DBpedia
      Joint Conference on Digital Libraries (JCDL), 2011
      Fabien Duchateau and Naimdjon Takhirov and Trond Aalberg

      @INPROCEEDINGS{jcdl11-demo,
        author = {Fabien Duchateau and Naimdjon Takhirov and Trond Aalberg},
        title = {FRBRPedia: a Tool for FRBRizing Web Products and Linking FRBR Entities to DBpedia},
        year = {2011},
        booktitle = {Joint Conference on Digital Libraries (JCDL)},
        pages = {455-456},
        publisher = {ACM},
        ee = {http://doi.acm.org/10.1145/1998076.1998183},
      }

    2. Supporting FRBRization of Web Product Descriptions
      Theory and Practice of Digital Libraries (TPDL), 2011
      Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg

      @INPROCEEDINGS{tpdl11-frbr,
        author = {Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg},
        title = {Supporting FRBRization of Web Product Descriptions},
        year = {2011},
        booktitle = {Theory and Practice of Digital Libraries (TPDL)},
        pages = {69-76},
        publisher = {Springer},
        isbn = {978-3-642-24468-1},
      }

    3. Linking FRBR Entities to LOD through Semantic Matching
      Theory and Practice of Digital Libraries (TPDL), 2011
      Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg

      @INPROCEEDINGS{tpdl11-lod,
        author = {Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg},
        title = {Linking FRBR Entities to LOD through Semantic Matching},
        year = {2011},
        booktitle = {Theory and Practice of Digital Libraries (TPDL)},
        pages = {284-295},
        publisher = {Springer},
        isbn = {978-3-642-24468-1},
      }

    4. FRBR-ML: A FRBR-based Framework for Semantic Interoperability
      Journal of Semantic Web, 2012
      Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg and Maja Zumer

      @ARTICLE{semweb12,
        author = {Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg and Maja Zumer},
        title = {FRBR-ML: A FRBR-based Framework for Semantic Interoperability},
        url = {http://dx.doi.org/10.3233/SW-2012-0044},
        year = {2012},
        pages = {23-43},
        publisher = {IOS Press},
        journal = {Journal of Semantic Web},
        volume = {3},
        number = {1},
        issn = {1570-0844},
        month = {jan},
      }

  • Logo FRBRizer
    FRBRizer

    Un outil de conversion des données bibliographiques au format MARC vers le modèle FRBR

    FRBRizer (aussi appelé marc2frbr) permet la conversion d'enregistrements bibliographiques au format MARC vers FRBR. Il utilise un ensemble de règles encodées dans un fichier XML. Un exemple de fichier de règles est fourni pour MARC21, mais FRBRizer est suffisament générique pour s'adapter aux autres dialectes de MARC. Plus de détails sur la page dédiée à FRBRizer.

    1. FRBRPedia: a Tool for FRBRizing Web Products and Linking FRBR Entities to DBpedia
      Joint Conference on Digital Libraries (JCDL), 2011
      Fabien Duchateau and Naimdjon Takhirov and Trond Aalberg

      @INPROCEEDINGS{jcdl11-demo,
        author = {Fabien Duchateau and Naimdjon Takhirov and Trond Aalberg},
        title = {FRBRPedia: a Tool for FRBRizing Web Products and Linking FRBR Entities to DBpedia},
        year = {2011},
        booktitle = {Joint Conference on Digital Libraries (JCDL)},
        pages = {455-456},
        publisher = {ACM},
        ee = {http://doi.acm.org/10.1145/1998076.1998183},
      }

    2. Supporting FRBRization of Web Product Descriptions
      Theory and Practice of Digital Libraries (TPDL), 2011
      Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg

      @INPROCEEDINGS{tpdl11-frbr,
        author = {Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg},
        title = {Supporting FRBRization of Web Product Descriptions},
        year = {2011},
        booktitle = {Theory and Practice of Digital Libraries (TPDL)},
        pages = {69-76},
        publisher = {Springer},
        isbn = {978-3-642-24468-1},
      }

    3. FRBR-ML: A FRBR-based Framework for Semantic Interoperability
      Journal of Semantic Web, 2012
      Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg and Maja Zumer

      @ARTICLE{semweb12,
        author = {Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg and Maja Zumer},
        title = {FRBR-ML: A FRBR-based Framework for Semantic Interoperability},
        url = {http://dx.doi.org/10.3233/SW-2012-0044},
        year = {2012},
        pages = {23-43},
        publisher = {IOS Press},
        journal = {Journal of Semantic Web},
        volume = {3},
        number = {1},
        issn = {1570-0844},
        month = {jan},
      }

  • Logo YAM
    YAM

    Une fabrique d'outils de mise en correspondance de schémas basée sur des techniques d'apprentissage pour combiner efficacement les mesures de similarité

    YAM (Yet Another Matcher) n'est pas (à nouveau) un autre outil de mise en correspondance de schémas. Il permet plutôt la génération de matchers à la carte, i.e., selon les besoins utilisateur. L'idée est de voir le problème d'appariement de schémas comme un problème de classification (correspondance ou non). Les besoins sont définis comme la préférence pour la précision ou le rappel, un jeu de données entraîné (exemples annotés), et des correspondances validées. YAM exploite une base de connaissances qui inclut un vaste ensemble de mesures de similarité et de classifieurs. En se basant sur les besoins utilisateur, YAM apprend une instance de classifieur qui combine les mesures de similarité de façon optimale afin d'obtenir la meilleure qualité d'appariement. Plus de détails sur la page dédiée à YAM.

    1. YAM: A Step Forward for Generating a Dedicated Schema Matcher
      Trans. Large-Scale Data- and Knowledge-Centered Systems (TLDKS), 2016
      Fabien Duchateau and Zohra Bellahsene

      @ARTICLE{tldks2016,
        author = {Fabien Duchateau and Zohra Bellahsene},
        title = {YAM: A Step Forward for Generating a Dedicated Schema Matcher},
        url = {http://dx.doi.org/10.1007/978-3-662-49534-6_5},
        year = {2016},
        pages = {150–185},
        journal = {Trans. Large-Scale Data- and Knowledge-Centered Systems (TLDKS)},
        doi = {10.1007/978-3-662-49534-6_5},
        volume = {25},
      }

    2. (Not) Yet Another Matcher
      Conference on Information and Knowledge Management (CIKM), 2009
      Fabien Duchateau and Remi Coletta and Zohra Bellahsene and Renée J. Miller

      @INPROCEEDINGS{cikm09,
        author = {Fabien Duchateau and Remi Coletta and Zohra Bellahsene and Renée J. Miller},
        title = {(Not) Yet Another Matcher},
        url = {http://doi.acm.org/10.1145/1645953.1646165},
        year = {2009},
        booktitle = {Conference on Information and Knowledge Management (CIKM)},
        pages = {1537-1540},
        ee = {http://doi.acm.org/10.1145/1645953.1646165},
        bibsource = {DBLP, http://dblp.uni-trier.de},
      }

    3. YAM: a Schema Matcher Factory
      Conference on Information and Knowledge Management (CIKM), 2009
      Fabien Duchateau and Remi Coletta and Zohra Bellahsene and Renée J. Miller

      @INPROCEEDINGS{cikm09demo,
        author = {Fabien Duchateau and Remi Coletta and Zohra Bellahsene and Renée J. Miller},
        title = {YAM: a Schema Matcher Factory},
        url = {http://doi.acm.org/10.1145/1645953.1646311},
        year = {2009},
        booktitle = {Conference on Information and Knowledge Management (CIKM)},
        pages = {2079-2080},
        ee = {http://doi.acm.org/10.1145/1645953.1646311},
      }

    4. Encore un outil de découverte de correspondances entre schémas XML?
      Bases de Données Avancées (BDA), 2009
      Fabien Duchateau and Remi Coletta and Zohra Bellahsene and Renée J. Miller

      @INPROCEEDINGS{bda09demo,
        author = {Fabien Duchateau and Remi Coletta and Zohra Bellahsene and Renée J. Miller},
        title = {Encore un outil de découverte de correspondances entre schémas XML?},
        year = {2009},
        booktitle = {Bases de Données Avancées (BDA)},
      }

  • Logo MatchPlanner
    MatchPlanner

    Un outil de mise en correspondance de schémas qui combine les mesures de similarité au moyen d'un arbre de décision

    MatchPlanner est un outil d'alignement de schémas qui utilise un arbre de décision pour combiner les mesures de similarité les plus pertinentes pour un domaine donné. Un premier avantage lié à l'arbre de décision est l'amélioration des performances du système puisque le nombre de mesures à exécuter est limité par la hauteur de l'arbre. Concernant la qualité des correspondances, seules les mesures les plus pertinentes sont utilisées, ce qui peut conduire à améliorer la qualité en ne privilégiant pas certaines catégories de mesures. Enfin MatchPlanner est capable d'apprendre de nouveaux arbres, permettant ainsi une configuration automatique du système pour un scénario donné. Plus de détails sur la page dédiée à MatchPlanner.

    1. A Flexible Approach for Planning Schema Matching Algorithms
      OTM Conferences, CooPerative Information Systems (CooPIS), 2008
      Fabien Duchateau and Zohra Bellahsene and Remi Coletta

      @INPROCEEDINGS{DBLP:conf/otm/DuchateauBC08,
        author = {Fabien Duchateau and Zohra Bellahsene and Remi Coletta},
        title = {A Flexible Approach for Planning Schema Matching Algorithms},
        url = {http://dx.doi.org/10.1007/978-3-540-88871-0_18},
        year = {2008},
        booktitle = {OTM Conferences, CooPerative Information Systems (CooPIS)},
        pages = {249-264},
        ee = {http://dx.doi.org/10.1007/978-3-540-88871-0_18},
        bibsource = {DBLP, http://dblp.uni-trier.de},
      }

  • Logo XBenchMatch
    XBenchMatch

    Un benchmark pour évaluer les outils de mise en correspondance de schémas

    XBenchMatch est un benchmark (banc d'essai, i.e., jeux de données et métriques d'évaluation) pour tester, comparer et évaluer les outils de mise en correspondance de schémas. Les métriques portent sur la qualité (précision, rappel, f-score, mais également des métriques sur la complétude ou la minimalité des schémas intégrés) et les performances (temps d'exécution). Plusieurs jeux de données caractérisés sont fournis afin d'évaluer de nouveaux algorithmes. Plus de détails sur la page dédiée à XBenchMatch.

    1. XBenchMatch: a Benchmark for XML Schema Matching Tools
      Very Large DataBases (VLDB), 2007
      Fabien Duchateau and Zohra Bellahsene and Ela Hunt

      @INPROCEEDINGS{DBLP:conf/vldb/DuchateauBH07,
        author = {Fabien Duchateau and Zohra Bellahsene and Ela Hunt},
        title = {XBenchMatch: a Benchmark for XML Schema Matching Tools},
        url = {http://www.vldb.org/conf/2007/papers/demo/p1318-duchateau.pdf},
        year = {2007},
        booktitle = {Very Large DataBases (VLDB)},
        pages = {1318-1321},
        ee = {http://www.vldb.org/conf/2007/papers/demo/p1318-duchateau.pdf},
      }

    2. Measuring the Quality of an Integrated Schema
      Conference on Conceptual Modelling (ER), 2010
      Fabien Duchateau and Zohra Bellahsene

      @INPROCEEDINGS{DBLP:conf/er/DuchateauB10,
        author = {Fabien Duchateau and Zohra Bellahsene},
        title = {Measuring the Quality of an Integrated Schema},
        url = {http://dx.doi.org/10.1007/978-3-642-16373-9_19},
        year = {2010},
        booktitle = {Conference on Conceptual Modelling (ER)},
        pages = {261-273},
        ee = {http://dx.doi.org/10.1007/978-3-642-16373-9_19},
        bibsource = {DBLP, http://dblp.uni-trier.de},
      }

    3. Matching and Alignment: What is the Cost of User Post-match Effort?
      OTM Conferences, CooPerative Information Systems (CooPIS), 2011
      Fabien Duchateau and Zohra Bellahsene and Remi Coletta

      @INPROCEEDINGS{coopis11,
        author = {Fabien Duchateau and Zohra Bellahsene and Remi Coletta},
        title = {Matching and Alignment: What is the Cost of User Post-match Effort?},
        year = {2011},
        booktitle = {OTM Conferences, CooPerative Information Systems (CooPIS)},
        pages = {421-428},
        publisher = {Springer},
      }

    4. On Evaluating Schema Matching and Mapping
      Schema Matching and Mapping, 2011
      Angela Bonifati and Zohra Bellahsene and Fabien Duchateau and Yannis Velegrakis

      @INBOOK{BonifatiBFV2011,
        author = {Angela Bonifati and Zohra Bellahsene and Fabien Duchateau and Yannis Velegrakis},
        title = {On Evaluating Schema Matching and Mapping},
        url = {http://www.springer.com/computer/book/978-3-642-16517-7},
        year = {2011},
        booktitle = {Schema Matching and Mapping},
        pages = {253-291},
        publisher = {Data-Centric Systems and Applications, Springer},
        chapter = {9},
      }

    5. Designing a Benchmark for the Assessment of Schema Matching Tools
      Open Journal of Databases (OJDB), 2014
      Fabien Duchateau and Zohra Bellahsene

      @INPROCEEDINGS{ojdb14,
        author = {Fabien Duchateau and Zohra Bellahsene},
        title = {Designing a Benchmark for the Assessment of Schema Matching Tools},
        url = {https://www.ronpub.com/journals/ojdb/2014-vol1/issue1/OJDB-v1i1n02_Duchateau.pdf},
        year = {2014},
        booktitle = {Open Journal of Databases (OJDB)},
        pages = {3-25},
        publisher = {RonPub, Germany},
        volume = {1},
        number = {1},
        issn = {2199-3459},
      }

  • Logo BMatch
    BMatch

    Un outil de mise en correspondance de schémas qui implémente une mesure de similarité structurelle et un arbre B- comme structure d'indexation

    BMatch est un outil de découverte de correspondances entre schémas XML, qui combine des mesures de similarité terminologique et structurelles. Les mesures terminologiques détectent des éléments avec des libellés similaires tandis que la mesure structurelle repose sur une comparaison du voisinage (calcul via la mesure cosinus). Un autre aspect de BMatch concerne l'amélioration des performances (temps d'exécution) par l'implémentation d'une structure d'indexation, l'arbre B-, pour accélérer la détection de corresponances. En effet, l'espace de recherche est réduit grâce au regroupement des éléments partageant des sous-ensembles (tokens) de libellés. Plus de détails sur la page dédiée à BMatch.

    1. A Context-based Measure for Discovering Approximate Semantic Matching between Schema Elements
      Research Challenges in Information Science (RCIS), 2007
      Fabien Duchateau and Zohra Bellahsene and Mathieu Roche

      @INPROCEEDINGS{DBLP:conf/rcis/FabienRB07,
        author = {Fabien Duchateau and Zohra Bellahsene and Mathieu Roche},
        title = {A Context-based Measure for Discovering Approximate Semantic Matching between Schema Elements},
        year = {2007},
        booktitle = {Research Challenges in Information Science (RCIS)},
        pages = {9-20},
        bibsource = {DBLP, http://dblp.uni-trier.de},
      }

    2. An Indexing Structure for Automatic Schema Matching
      International Conference on Data Engineering (ICDE) - Workshops, 2007
      Fabien Duchateau and Zohra Bellahsene and Mark Roantree and Mathieu Roche

      @INPROCEEDINGS{DBLP:conf/icde/DuchateauBRR07,
        author = {Fabien Duchateau and Zohra Bellahsene and Mark Roantree and Mathieu Roche},
        title = {An Indexing Structure for Automatic Schema Matching},
        url = {http://dx.doi.org/10.1109/ICDEW.2007.4401032},
        year = {2007},
        booktitle = {International Conference on Data Engineering (ICDE) - Workshops},
        pages = {485-491},
        ee = {http://dx.doi.org/10.1109/ICDEW.2007.4401032},
        bibsource = {DBLP, http://dblp.uni-trier.de},
      }

    3. BMatch: a Semantically Context-based Tool Enhanced by an Indexing Structure to Accelerate Schema Matching
      Base de Données Avancées (BDA), 2007
      Fabien Duchateau and Zohra Bellahsene and Mathieu Roche

      @INPROCEEDINGS{DBLP:conf/bda/DuchateauBR07,
        author = {Fabien Duchateau and Zohra Bellahsene and Mathieu Roche},
        title = {BMatch: a Semantically Context-based Tool Enhanced by an Indexing Structure to Accelerate Schema Matching},
        year = {2007},
        booktitle = {Base de Données Avancées (BDA)},
        bibsource = {DBLP, http://dblp.uni-trier.de},
      }

    4. Improving quality and performance of schema matching in large scale
      Ingénierie des Systèmes d'Information (ISI), 2008
      Fabien Duchateau and Zohra Bellahsene and Mathieu Roche

      @ARTICLE{DBLP:journals/isi/DuchateauBR08,
        author = {Fabien Duchateau and Zohra Bellahsene and Mathieu Roche},
        title = {Improving quality and performance of schema matching in large scale},
        url = {http://dx.doi.org/10.3166/isi.13.5.59-82},
        year = {2008},
        pages = {59-82},
        ee = {http://dx.doi.org/10.3166/isi.13.5.59-82},
        journal = {Ingénierie des Systèmes d'Information (ISI)},
        volume = {13},
        number = {5},
        bibsource = {DBLP, http://dblp.uni-trier.de},
      }

Encadrements de stage, thèse de doctorat et postdoctorat

De nombreux projets liés aussi bien à l'enseignement qu'à la recherche ne verraient pas le jour sans la participation des étudiant-e-s. Ci-dessous, les étudiant-e-s que j'ai (eu) le plaisir de (co-)encadrer.

Les étudiant.e.s encadré.e.s dans le cadre d'un Projet d'Orientation en Master (POM, ex-TER) apparaissent sur la page de l'UE POM.

Étudiant.e.s Dates Détails sur la collaboration
Post-doctoratWissame Laddada2020
(7 mois)
  • Recommandations dans le contexte immobilier
  • Postdoctorat financé sur le projet IMU HiL
Wei Yan2019 - 2020
(1 an)
Nader Jelassi2018 - 2019
(5 mois)
  • Recommandations dans le contexte immobilier
  • Postdoctorat financé sur le projet IMU HiL
DoctoratJoffrey Decourselle2014 - 2018
Bilal Berjawi2013 - 2017
Naimdjon Takhirov2011 - 2013
MasterNelly Barret2020
(6 mois)
Pauline Moullé, Alexis Koralewski, Thibaut Thalamas2020
(3 mois)
Louis Béranger, Rémi Séraphin2019
(3 mois)
Grégory Howard2016
(3 mois)
Mohamed Benaïssa2014
(6 mois)
Kamel Taouche2014
(6 mois)
  • Optimisation et extension sémantique d'un algorithme de traitement de requêtes agrégatives
  • Rapport de stage
Emmanuel Gaude2013
(5 mois)
LicenceCamille Humbert, Estelle Perret2019
(4 mois)
Lucie Tournayre, Somia Saidi2019
(4 mois)
Nelly Barret2018
(3 mois)
Oliver Conus2013
(3 mois)
Lan Thao Le Thi, Aurélien Chemier, Jonathan Cohen, Oliver Conus,
Abdoulaye Keita, Vi-Nam Khuong, Quoc Vuong Nguyen
2013
(3 mois)
  • Développement d'une application de gestion de ressources pour l'UCBL (projet ADRess)
  • Cahier des charges
Thomas Piccolo2012
(3 mois)
Rémi Fialin2012
(3 mois)