Fabien Duchateau

Page de Fabien Duchateau

Site web UCBL Site web LIRIS


Version anglaise

Prototypes

  • Logo Predihood
    Predihood

    Predihood est une application cartographique pour prédire des connaissances sur des quartiers (e.g., caractéristiques environnementales, possibilité de lieu de repos pour les oiseaux migrateurs, problèmes de santé).

    Predihood est une application cartographique pour prédire des connaissances sur des quartiers (e.g., caractéristiques environnementales, possibilité de lieu de repos pour les oiseaux migrateurs, problèmes de santé). L'outil est extensible en termes de jeux de données et d'algorithmes de prédiction. La partie cartographique de l'application permet de visualiser les quartiers et leurs indicateurs (e.g., nombre de boulangeries, revenu moyen ou nombre de maisons de plus de 250m^2), ainsi que les résultats de prédiction pour les quartiers sélectionnés. La partie configuration de l'application permet de tester différents paramètrages des algorithmes de prédiction sur un jeu de données. Elle est développée en Python et JavaScript et repose sur les librairies Mongiris (stockage des IRIS en GeoJSON) et Scikit-learn (algorithmes d'apprentissage). Plus de détails sur la page dédiée à Predihood.

    1. Predihood: an open-source tool for predicting neighbourhoods' information
      Journal of Open Source Software (JOSS), 2021
      Nelly Barret and Fabien Duchateau and Franck Favetta

      @article {joss2021,
        doi = {10.21105/joss.02805},
        url = {https://doi.org/10.21105/joss.02805},
        year = {2021},
        publisher = {The Open Journal},
        volume = {6},
        number = {61},
        pages = {2805},
        author = {Nelly Barret and Fabien Duchateau and Franck Favetta},
        title = {Predihood: an open-source tool for predicting neighbourhoods' information},
        journal = {Journal of Open Source Software (JOSS)},
      }

    2. An Environmental Study of French Neighbourhoods
      Data Management Technologies and Applications, 2021
      Nelly Barret and Fabien Duchateau and Franck Favetta and Aurélien Gentil and Loïc Bonneval

      @inproceedings {ccis2021,
        author = {Nelly Barret and Fabien Duchateau and Franck Favetta and Aurélien Gentil and Loïc Bonneval},
        editor = {Hammoudi, Slimane and Quix, Christoph and Bernardino, Jorge},
        title = {An Environmental Study of French Neighbourhoods},
        booktitle = {Data Management Technologies and Applications},
        year = {2021},
        publisher = {Springer},
        pages = {267–292},
        abstract = {Neighbourhoods are key places for daily activities and many studies in social sciences, health or biology use this spatial concept as an impact factor. Conversely, the neighbourhood environment is rarely defined (e.g., in terms of landscape or main social class). In this paper, we propose six descriptive variables for this environment, and we provide a dataset of 270 annotated neighbourhoods. Next, we detail two methods (prediction and spatial computation) for describing environment of remaining neighbourhoods, and we show in our set of experiments an acceptable quality.},
        isbn = {978-3-030-83014-4},
        url = {https://doi.org/10.1007/978-3-030-83014-4_13},
      }

    3. Predicting the Environment of a Neighborhood: a Use Case for France
      International Conference on Data Management Technologies and Applications (DATA), 2020
      Nelly Barret and Fabien Duchateau and Franck Favetta and Loïc Bonneval

      @inproceedings {data20,
        author = {Nelly Barret and Fabien Duchateau and Franck Favetta and Loïc Bonneval},
        title = {Predicting the Environment of a Neighborhood: a Use Case for France},
        booktitle = {International Conference on Data Management Technologies and Applications (DATA)},
        year = {2020},
        pages = {294-301},
        isbn = {978-989-758-440-4},
        publisher = {SciTePress},
        doi = {10.5220/0009885702940301},
      }

    4. À la recherche du quartier idéal
      Extraction et Gestion des Connaissances (EGC), 2019
      Nelly Barret and Fabien Duchateau and Franck Favetta and Maryvonne Miquel and Aurélien Gentil and Loïc Bonneval

      @inproceedings {egc19-demo,
        author = {Nelly Barret and Fabien Duchateau and Franck Favetta and Maryvonne Miquel and Aurélien Gentil and Loïc Bonneval},
        title = {À la recherche du quartier idéal},
        booktitle = {Extraction et Gestion des Connaissances (EGC)},
        pages = {429–432},
        year = {2019},
        url = {http://editions-rnti.fr/?inprocid=1002526},
      }

    5. Étude des quartiers : défis et pistes de recherche
      Extraction et Gestion des Connaissances (EGC) - atelier DAHLIA, 2019
      Loïc Bonneval and Fabien Duchateau and Franck Favetta and Aurélien Gentil and Mohamed Nader Jelassi and Maryvonne Miquel and Ludovic Moncla

      @inproceedings {egc19-dahlia,
        author = {Loïc Bonneval and Fabien Duchateau and Franck Favetta and Aurélien Gentil and Mohamed Nader Jelassi and Maryvonne Miquel and Ludovic Moncla},
        title = {Étude des quartiers : défis et pistes de recherche},
        booktitle = {Extraction et Gestion des Connaissances (EGC) - atelier DAHLIA},
        year = {2019},
        url = {http://dahlia.egc.asso.fr/atelierDAHLIA-EGC2020.html},
      }

  • Logo Mapiris
    Mapiris

    Mapiris est une application cartographique pour la recherche et la visualisation des IRIS (unités administratives définies par l'INSEE, un peu similaires aux quartiers, environ 50000 IRIS sur le territoire français) et les indicateurs qui les décrivent (e.g., nombre de boulangeries, nombre et type d'établissements scolaires, pourcentage d'habitant.e.s selon les catégories socio-professionnelles).

    Mapiris est une application cartographique pour la recherche et la visualisation des IRIS (unités administratives définies par l'INSEE, un peu similaires aux quartiers, environ 50000 IRIS sur le terrtitoire français) et les indicateurs qui les décrivent (e.g., nombre de boulangeries, nombre et type d'établissements scolaires, pourcentage d'habitant.e.s selon les catégories socio-professionnelles). Elle permet de chercher les IRIS par code, par nom (d'IRIS ou de commune) et d'afficher les IRIS sur une zone géographique donnée. Elle est développée en Python et JavaScript et repose sur la librairie Mongiris (stockage des IRIS en GeoJSON). Plus de détails sur la page dédiée à Mapiris ou celle de Mongiris.

    1. Predihood: an open-source tool for predicting neighbourhoods' information
      Journal of Open Source Software (JOSS), 2021
      Nelly Barret and Fabien Duchateau and Franck Favetta

      @article {joss2021,
        doi = {10.21105/joss.02805},
        url = {https://doi.org/10.21105/joss.02805},
        year = {2021},
        publisher = {The Open Journal},
        volume = {6},
        number = {61},
        pages = {2805},
        author = {Nelly Barret and Fabien Duchateau and Franck Favetta},
        title = {Predihood: an open-source tool for predicting neighbourhoods' information},
        journal = {Journal of Open Source Software (JOSS)},
      }

    2. An Environmental Study of French Neighbourhoods
      Data Management Technologies and Applications, 2021
      Nelly Barret and Fabien Duchateau and Franck Favetta and Aurélien Gentil and Loïc Bonneval

      @inproceedings {ccis2021,
        author = {Nelly Barret and Fabien Duchateau and Franck Favetta and Aurélien Gentil and Loïc Bonneval},
        editor = {Hammoudi, Slimane and Quix, Christoph and Bernardino, Jorge},
        title = {An Environmental Study of French Neighbourhoods},
        booktitle = {Data Management Technologies and Applications},
        year = {2021},
        publisher = {Springer},
        pages = {267–292},
        abstract = {Neighbourhoods are key places for daily activities and many studies in social sciences, health or biology use this spatial concept as an impact factor. Conversely, the neighbourhood environment is rarely defined (e.g., in terms of landscape or main social class). In this paper, we propose six descriptive variables for this environment, and we provide a dataset of 270 annotated neighbourhoods. Next, we detail two methods (prediction and spatial computation) for describing environment of remaining neighbourhoods, and we show in our set of experiments an acceptable quality.},
        isbn = {978-3-030-83014-4},
        url = {https://doi.org/10.1007/978-3-030-83014-4_13},
      }

    3. Predicting the Environment of a Neighborhood: a Use Case for France
      International Conference on Data Management Technologies and Applications (DATA), 2020
      Nelly Barret and Fabien Duchateau and Franck Favetta and Loïc Bonneval

      @inproceedings {data20,
        author = {Nelly Barret and Fabien Duchateau and Franck Favetta and Loïc Bonneval},
        title = {Predicting the Environment of a Neighborhood: a Use Case for France},
        booktitle = {International Conference on Data Management Technologies and Applications (DATA)},
        year = {2020},
        pages = {294-301},
        isbn = {978-989-758-440-4},
        publisher = {SciTePress},
        doi = {10.5220/0009885702940301},
      }

    4. À la recherche du quartier idéal
      Extraction et Gestion des Connaissances (EGC), 2019
      Nelly Barret and Fabien Duchateau and Franck Favetta and Maryvonne Miquel and Aurélien Gentil and Loïc Bonneval

      @inproceedings {egc19-demo,
        author = {Nelly Barret and Fabien Duchateau and Franck Favetta and Maryvonne Miquel and Aurélien Gentil and Loïc Bonneval},
        title = {À la recherche du quartier idéal},
        booktitle = {Extraction et Gestion des Connaissances (EGC)},
        pages = {429–432},
        year = {2019},
        url = {http://editions-rnti.fr/?inprocid=1002526},
      }

    5. Étude des quartiers : défis et pistes de recherche
      Extraction et Gestion des Connaissances (EGC) - atelier DAHLIA, 2019
      Loïc Bonneval and Fabien Duchateau and Franck Favetta and Aurélien Gentil and Mohamed Nader Jelassi and Maryvonne Miquel and Ludovic Moncla

      @inproceedings {egc19-dahlia,
        author = {Loïc Bonneval and Fabien Duchateau and Franck Favetta and Aurélien Gentil and Mohamed Nader Jelassi and Maryvonne Miquel and Ludovic Moncla},
        title = {Étude des quartiers : défis et pistes de recherche},
        booktitle = {Extraction et Gestion des Connaissances (EGC) - atelier DAHLIA},
        year = {2019},
        url = {http://dahlia.egc.asso.fr/atelierDAHLIA-EGC2020.html},
      }

  • Logo Mongiris
    Mongiris

    Une librairie Python pour manipuler les IRIS (définis par l'INSEE, sorte de quartiers, 50 000 pour la France), qui sont stockés sous forme de documents dans MongoDB.

    Ce package Python est une interface pour interroger des IRIS (unité administrative définie par l'INSEE) stockés sous forme de documents MongoDB. Chaque IRIS inclut des indicateurs (e.g., revenu moyen, nombre de boulangeries ou d'écoles, type de maisons) qui sont utiles pour des études en sciences sociales, pour la recommandation de quartiers, etc. Dans ce package, les ~50000 IRIS et leurs 350-650 indicateurs ont été intégrés et stockés au format GeoJSON, et une API permet de manipuler ces données. Plus de détails sur la page dédiée à Mongiris ou celle de Mapiris.

    1. Predihood: an open-source tool for predicting neighbourhoods' information
      Journal of Open Source Software (JOSS), 2021
      Nelly Barret and Fabien Duchateau and Franck Favetta

      @article {joss2021,
        doi = {10.21105/joss.02805},
        url = {https://doi.org/10.21105/joss.02805},
        year = {2021},
        publisher = {The Open Journal},
        volume = {6},
        number = {61},
        pages = {2805},
        author = {Nelly Barret and Fabien Duchateau and Franck Favetta},
        title = {Predihood: an open-source tool for predicting neighbourhoods' information},
        journal = {Journal of Open Source Software (JOSS)},
      }

    2. An Environmental Study of French Neighbourhoods
      Data Management Technologies and Applications, 2021
      Nelly Barret and Fabien Duchateau and Franck Favetta and Aurélien Gentil and Loïc Bonneval

      @inproceedings {ccis2021,
        author = {Nelly Barret and Fabien Duchateau and Franck Favetta and Aurélien Gentil and Loïc Bonneval},
        editor = {Hammoudi, Slimane and Quix, Christoph and Bernardino, Jorge},
        title = {An Environmental Study of French Neighbourhoods},
        booktitle = {Data Management Technologies and Applications},
        year = {2021},
        publisher = {Springer},
        pages = {267–292},
        abstract = {Neighbourhoods are key places for daily activities and many studies in social sciences, health or biology use this spatial concept as an impact factor. Conversely, the neighbourhood environment is rarely defined (e.g., in terms of landscape or main social class). In this paper, we propose six descriptive variables for this environment, and we provide a dataset of 270 annotated neighbourhoods. Next, we detail two methods (prediction and spatial computation) for describing environment of remaining neighbourhoods, and we show in our set of experiments an acceptable quality.},
        isbn = {978-3-030-83014-4},
        url = {https://doi.org/10.1007/978-3-030-83014-4_13},
      }

    3. Predicting the Environment of a Neighborhood: a Use Case for France
      International Conference on Data Management Technologies and Applications (DATA), 2020
      Nelly Barret and Fabien Duchateau and Franck Favetta and Loïc Bonneval

      @inproceedings {data20,
        author = {Nelly Barret and Fabien Duchateau and Franck Favetta and Loïc Bonneval},
        title = {Predicting the Environment of a Neighborhood: a Use Case for France},
        booktitle = {International Conference on Data Management Technologies and Applications (DATA)},
        year = {2020},
        pages = {294-301},
        isbn = {978-989-758-440-4},
        publisher = {SciTePress},
        doi = {10.5220/0009885702940301},
      }

    4. À la recherche du quartier idéal
      Extraction et Gestion des Connaissances (EGC), 2019
      Nelly Barret and Fabien Duchateau and Franck Favetta and Maryvonne Miquel and Aurélien Gentil and Loïc Bonneval

      @inproceedings {egc19-demo,
        author = {Nelly Barret and Fabien Duchateau and Franck Favetta and Maryvonne Miquel and Aurélien Gentil and Loïc Bonneval},
        title = {À la recherche du quartier idéal},
        booktitle = {Extraction et Gestion des Connaissances (EGC)},
        pages = {429–432},
        year = {2019},
        url = {http://editions-rnti.fr/?inprocid=1002526},
      }

    5. Étude des quartiers : défis et pistes de recherche
      Extraction et Gestion des Connaissances (EGC) - atelier DAHLIA, 2019
      Loïc Bonneval and Fabien Duchateau and Franck Favetta and Aurélien Gentil and Mohamed Nader Jelassi and Maryvonne Miquel and Ludovic Moncla

      @inproceedings {egc19-dahlia,
        author = {Loïc Bonneval and Fabien Duchateau and Franck Favetta and Aurélien Gentil and Mohamed Nader Jelassi and Maryvonne Miquel and Ludovic Moncla},
        title = {Étude des quartiers : défis et pistes de recherche},
        booktitle = {Extraction et Gestion des Connaissances (EGC) - atelier DAHLIA},
        year = {2019},
        url = {http://dahlia.egc.asso.fr/atelierDAHLIA-EGC2020.html},
      }

  • Logo GeoAlign
    GeoAlign

    Un outil d'appariement spatial entre Geonames, Here, OpenStreetMap et Bing Maps

    Les points d'intérêt (POI) sont cruciaux dans de nombreuses applications, par exemple touristiques, de recherche d'itinéraires ou de gestion de crise. Les fournisseurs cartographiques représentent traditionnellement ces POI au moyen d'une entité spatiale. Cependant,, la description de ces entités peut varier de façon significative d'un fournisseur à un autre (e.g., propriétés manquantes, informations obsolètes, valeurs incohérentes). L'appariement d'entités spatiales a pour objectif la détection de correspondances entre entités représentant le même POI. La plupart des approches existantes utilisent une fonction de combinaison de mesures de similarité qui est fixe, ce qui limite grandement sa configuration. De plus, l'évaluation de la qualité obtenue par ces approches d'appariement d'entités spatiales est une tâche difficile à cause de l'absence d'un jeu de données expertisé pour toutes les entités de tous les fournisseurs. GeoAlign est une application qui permet une configuration poussée lors de l'appariement de données spatiales entre Geonames, Here, OpenStreetMap et Bing Maps. Elle est également utile pour estimer la qualité des correspondances en se basant sur les caractéristiques des fonctions de combinaison et pour visualiser cette estimation en termes de vrais et faux positifs. Plus de détails sur la page dédiée à GeoAlign.

    1. Spatial Entity Matching with GeoAlign
      International Conference on Advances in Geographic Information Systems (SIGSPATIAL), 2019
      Nelly Barret and Fabien Duchateau and Franck Favetta and Ludovic Moncla

      @inproceedings {sigspatial19demo,
        author = {Nelly Barret and Fabien Duchateau and Franck Favetta and Ludovic Moncla},
        title = {Spatial Entity Matching with GeoAlign},
        booktitle = {International Conference on Advances in Geographic Information Systems (SIGSPATIAL)},
        year = {2019},
        pages = {580–583},
        publisher = {ACM},
        ee = {http://dx.doi.org/10.1145/3347146.3359345},
      }

  • Logo VizLIRIS
    VizLIRIS

    Un outil de recommandation de quartiers

    Le choix d'unquartier est primordial lors d'un achat ou d'une location immobilière. Or, il est fréquent de ne pas connaître la ville où l'on arrive (e.g., mutation professionnelle) et la sélection d'un quartier pertinent devient alors un véritable défi. VizLIRIS facilite la comparaison entre quartiers en exploitant plusieurs centaines d'indicateurs INSEE pour différencier les quartiers. Une dizaine d'algorithmes d'apprentissage (K-means, SVM, Spectral Clustering, etc.) permettent soit de recommander un quartier (à partir de quartiers initiaux dans une autre ville), soit de regrouper des quartiers similaires dans une zone géographique donnée. Plus de détails sur la page dédiée à VizLIRIS.

    1. À la recherche du quartier idéal
      Extraction et Gestion des Connaissances (EGC), 2019
      Nelly Barret and Fabien Duchateau and Franck Favetta and Maryvonne Miquel and Aurélien Gentil and Loïc Bonneval

      @inproceedings {egc19-demo,
        author = {Nelly Barret and Fabien Duchateau and Franck Favetta and Maryvonne Miquel and Aurélien Gentil and Loïc Bonneval},
        title = {À la recherche du quartier idéal},
        booktitle = {Extraction et Gestion des Connaissances (EGC)},
        pages = {429–432},
        year = {2019},
        url = {http://editions-rnti.fr/?inprocid=1002526},
      }

    2. Étude des quartiers : défis et pistes de recherche
      Extraction et Gestion des Connaissances (EGC) - atelier DAHLIA, 2019
      Loïc Bonneval and Fabien Duchateau and Franck Favetta and Aurélien Gentil and Mohamed Nader Jelassi and Maryvonne Miquel and Ludovic Moncla

      @inproceedings {egc19-dahlia,
        author = {Loïc Bonneval and Fabien Duchateau and Franck Favetta and Aurélien Gentil and Mohamed Nader Jelassi and Maryvonne Miquel and Ludovic Moncla},
        title = {Étude des quartiers : défis et pistes de recherche},
        booktitle = {Extraction et Gestion des Connaissances (EGC) - atelier DAHLIA},
        year = {2019},
        url = {http://dahlia.egc.asso.fr/atelierDAHLIA-EGC2020.html},
      }

  • Logo BIB-R
    BIB-R

    Un benchmark pour l'évaluation des outils d'interprétation de notices bibliographiques (FRBRisation)

    BIB-R est un benchmark (banc d'essai, i.e., jeux de données et métriques d'évaluation) pour l'interprétation des enregistrements bibliographiques. Il inclut deux jeux de données (T42 et BIB-RCAT) dédiés à l'évaluation du processus de FRBRisation (transformation des enregistrements en MARC vers FRBR). L'objectif de T42 est d'identifier les points forts et faiblesses d'un outil de FRBRisation en testant tous les problèmes qui peuvent survenir durant le processus. Le second jeu de données BIB-RCAT est extrait de plusieurs catalogues d'institutions culturelles et peut être utilisé pour comparer ou expérimenter un outil avec une qualité de données similaire à celles de catalogues réels. Les collections FRBR attendues (résultat expertisé) sont inclus dans BIB-R pour permettre une évaluation automatique. Les données d'entrée sont au format MARC/XML tandis que les collections FRBR sont disponibles en RDF/XML. Plus de détails sur la page dédiée à BIB-R.

    1. Open Datasets for Evaluating the Interpretation of Bibliographic Records
      Joint Conference on Digital Libraries (JCDL), 2016
      Decourselle, Joffrey and Duchateau, Fabien and Aalberg, Trond and Takhirov, Naimdjon and Lumineau, Nicolas

      @inproceedings {jcdl2016poster,
        author = {Decourselle, Joffrey and Duchateau, Fabien and Aalberg, Trond and Takhirov, Naimdjon and Lumineau, Nicolas},
        title = {Open Datasets for Evaluating the Interpretation of Bibliographic Records},
        booktitle = {Joint Conference on Digital Libraries (JCDL)},
        series = {JCDL '16},
        year = {2016},
        isbn = {978-1-4503-4229-2},
        location = {Newark, New Jersey, USA},
        pages = {253–254},
        numpages = {2},
        url = {http://doi.acm.org/10.1145/2910896.2925457},
        doi = {10.1145/2910896.2925457},
        publisher = {ACM},
        address = {New York, NY, USA},
        keywords = {dataset, frbr, frbrization, migration, record interpretation},
      }

    2. BIB-R: A Benchmark for the Interpretation of Bibliographic Records
      Theory and Practice of Digital Libraries (TPDL), 2016
      Joffrey Decourselle and Fabien Duchateau and Trond Aalberg and Naimdjon Takhirov and Nicolas Lumineau

      @inproceedings {tpdl16,
        author = {Joffrey Decourselle and Fabien Duchateau and Trond Aalberg and Naimdjon Takhirov and Nicolas Lumineau},
        title = {BIB-R: A Benchmark for the Interpretation of Bibliographic Records},
        booktitle = {Theory and Practice of Digital Libraries (TPDL)},
        pages = {163–174},
        year = {2016},
        url = {http://dx.doi.org/10.1007/978-3-319-43997-6_13},
        doi = {10.1007/978-3-319-43997-6_13},
      }

  • Logo GeoBench
    GeoBench

    Un outil d'intégration spatiale, pour générer un benchmark pour l'appariement d'entités spatiales ou pour construire une carte avec des informations complètes sur ses lieux favoris

    GeoBench est une application web qui facilite la création d'un benchmark (jeu de données) pour l'appariement d'entités spatiales. Sa fonctionnalité principale est de rechercher des points d'intérêt (e.g., restautants, hôtels) chez différents fournisseurs cartographiques (actuellement Geonames, Here et Google Maps) et de suggérer les entités correspondantes. L'interface facilite la validation de ces correspondances et permet de préciser le type de différences entre les valeurs d'attributs correspondants. Hormis la construction d'un jeu de données expertisé, GeoBench implémente aussi la fusion d'entités correspondances en une seule, ce qui permet aux utilisateurs de générer une carte personnalisée avec des informations complètes et cohérentes sur leurs lieux préférés. Plus de détails sur la page dédiée à GeoBench.

    1. PABench: Designing a Taxonomy and Implementing a Benchmark for Spatial Entity Matching
      International Conference on Advanced Geographic Information Systems, Applications, and Services (GEOProcessing), 2015
      Bilal Berjawi and Fabien Duchateau and Franck Favetta and Maryvonne Miquel and Robert Laurini

      @inproceedings {geoprocessing15,
        title = {PABench: Designing a Taxonomy and Implementing a Benchmark for Spatial Entity Matching},
        author = {Bilal Berjawi and Fabien Duchateau and Franck Favetta and Maryvonne Miquel and Robert Laurini},
        year = {2015},
        month = {feb},
        booktitle = {International Conference on Advanced Geographic Information Systems, Applications, and Services (GEOProcessing)},
        pages = {7-16},
        isbn = {978-1-61208-048-2},
        language = {en},
        url = {http://perso.liris.cnrs.fr/publis/?id=7017},
      }

    2. GeoBench: a Geospatial Integration Tool for Building a Spatial Entity Matching Benchmark
      International Conference on Advances in Geographic Information Systems (SIGSPATIAL), 2014
      Anthony Morana and Thomas Morel and Bilal Berjawi and Fabien Duchateau

      @inproceedings {sigspatial14demo,
        author = {Anthony Morana and Thomas Morel and Bilal Berjawi and Fabien Duchateau},
        title = {GeoBench: a Geospatial Integration Tool for Building a Spatial Entity Matching Benchmark},
        booktitle = {International Conference on Advances in Geographic Information Systems (SIGSPATIAL)},
        year = {2014},
        pages = {533-536},
        publisher = {ACM},
        ee = {http://dx.doi.org/10.1145/2666310.2666362},
      }

    3. Detection, Integration and Correction Methods for Homologous Geographic Objects
      Communication IMU ALPHA, 2013
      Bilal Berjawi and Franck Favetta and Fabien Duchateau and Maryvonne Miquel and Robert Laurini

      @techreport {IMU-alpha13,
        author = {Bilal Berjawi and Franck Favetta and Fabien Duchateau and Maryvonne Miquel and Robert Laurini},
        title = {Detection, Integration and Correction Methods for Homologous Geographic Objects},
        institution = {Laboratoire LIRIS},
        year = {2013},
        type = {Communication IMU ALPHA},
        url = {http://imualpha.hypotheses.org/99},
      }

  • Logo KIEV
    KIEV

    Un outil d'extraction de relations binaires dans des documents textuels

    KIEV (aussi appelé SPIDER) a pour objectif l'extraction de relations binaires à partir de documents textuels afin de peupler des triplestores (RDF) ou des bases de connaissances. Il combine une partie sémantique (extension des libellés, regroupement de termes fréquents) avec des techniques de traitement automatique du langage (Part Of Speech tagging) pour générer des motifs pertinents pour un type spécifique de relation. Trois cas d'utilisation sont présentés : le premier permet la détection du ou des types de relation entre deux entités données (e.g., relation 'parodie' entre les entités 'lord of the rings' et 'bored of the rings'). Le second s'intéresse à la découverte d'entités objet à partir d'une entité sujet et d'un type de relation (e.g., objet 'lord of the rings' pour 'bored of the rings' + 'parody'). Enfin, le dernier cas d'utilisation fournit des exemples (paires d'entités) qui satisfont un type de relation donné. Plus de détails sur la page dédiée à KIEV.

    1. KIEV: a Tool for Extracting Semantic Relations from the World Wide Web
      International Conference on Extending Database Technology (EDBT), 2014
      Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg and Ingeborg Solvberg

      @inproceedings {edbt14demo,
        author = {Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg and Ingeborg Solvberg},
        title = {KIEV: a Tool for Extracting Semantic Relations from the World Wide Web},
        booktitle = {International Conference on Extending Database Technology (EDBT)},
        year = {2014},
        pages = {632-635},
        publisher = {OpenProceedings.org},
        ee = {http://dx.doi.org/10.5441/002/edbt.2014.61},
      }

    2. An Integrated Approach for Large-Scale Relation Extraction from the Web
      Asia-Pacific Web Conference (APWeb), 2013
      Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg and Ingeborg Solvberg

      @inproceedings {apweb13,
        author = {Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg and Ingeborg Solvberg},
        title = {An Integrated Approach for Large-Scale Relation Extraction from the Web},
        booktitle = {Asia-Pacific Web Conference (APWeb)},
        year = {2013},
        pages = {163-175},
        url = {http://dx.doi.org/10.1007/978-3-642-37401-2_18},
        publisher = {Springer},
        ee = {http://dx.doi.org/10.1007/978-3-642-37401-2_18},
      }

    3. An Evidence-based Verification Approach to Extract Entities for Knowledge Base Population
      International Semantic Web Conference (ISWC), 2012
      Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg

      @inproceedings {iswc12,
        author = {Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg},
        title = {An Evidence-based Verification Approach to Extract Entities for Knowledge Base Population},
        booktitle = {International Semantic Web Conference (ISWC)},
        year = {2012},
        pages = {575-590},
        publisher = {Springer},
        url = {http://dx.doi.org/10.1007/978-3-642-35176-1_36},
      }

  • Logo Repérage
    Repérage

    Un outil de repérage urbain à travers la prise de points de repère

    Le projet 'questions de repérage' a pour but d'analyser comment une personne se repère en ville. En utilisant l'interface web, un.e utilisateur.ice peut produire une carte personnalisée, représentant ses quartiers favoris et les éléments géographiques qui l'aident à s'y localiser.

    1. Outil de repérage urbain à travers la prise de points de repère
      Prototype, 2013
      Bilal Berjawi and Maxime Colomb and Thierry Joliveau and Franck Favetta and Fabien Duchateau and Maryvonne Miquel

      @techreport {dev-EVS-LIRIS13,
        author = {Bilal Berjawi and Maxime Colomb and Thierry Joliveau and Franck Favetta and Fabien Duchateau and Maryvonne Miquel},
        title = {Outil de repérage urbain à travers la prise de points de repère},
        institution = {Laboratoires EVS et LIRIS},
        year = {2013},
        type = {Prototype},
      }

    2. Detection, Integration and Correction Methods for Homologous Geographic Objects
      Communication IMU ALPHA, 2013
      Bilal Berjawi and Franck Favetta and Fabien Duchateau and Maryvonne Miquel and Robert Laurini

      @techreport {IMU-alpha13,
        author = {Bilal Berjawi and Franck Favetta and Fabien Duchateau and Maryvonne Miquel and Robert Laurini},
        title = {Detection, Integration and Correction Methods for Homologous Geographic Objects},
        institution = {Laboratoire LIRIS},
        year = {2013},
        type = {Communication IMU ALPHA},
        url = {http://imualpha.hypotheses.org/99},
      }

  • Logo FRBRpedia
    FRBRpedia

    Un plugin pour convertir un produit vendu sur le web selon le modèle FRBR et en connectant ses entités au Linked Open Data cloud (LOD)

    FRBRpedia est un plugin pour FRBRiser des produits du web, c'st à dire de les transformer selon le modèle FRBR. Cela implique la détection des entités Work (oeuvre), Agents (e.g., personne auteure, traductrice, illustratrice), Expression et Manifestation à partir des informations du produit. De plus, FRBRpedia essaie d'enrichir les entités extraites en les reliant au Linked Open Data (LOD). Le plugin supporte uniquement des produits Amazon et un enrichissement vers DBpedia. Plus de détails sur la page dédiée à FRBRpedia.

    1. FRBR-ML: A FRBR-based Framework for Semantic Interoperability
      Journal of Semantic Web, 2012
      Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg and Maja Zumer

      @article {semweb12,
        author = {Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg and Maja Zumer},
        title = {FRBR-ML: A FRBR-based Framework for Semantic Interoperability},
        journal = {Journal of Semantic Web},
        publisher = {IOS Press},
        year = {2012},
        volume = {3},
        number = {1},
        month = {jan},
        url = {http://dx.doi.org/10.3233/SW-2012-0044},
        issn = {1570-0844},
        pages = {23-43},
      }

    2. FRBRPedia: a Tool for FRBRizing Web Products and Linking FRBR Entities to DBpedia
      Joint Conference on Digital Libraries (JCDL), 2011
      Fabien Duchateau and Naimdjon Takhirov and Trond Aalberg

      @inproceedings {jcdl11-demo,
        author = {Fabien Duchateau and Naimdjon Takhirov and Trond Aalberg},
        title = {FRBRPedia: a Tool for FRBRizing Web Products and Linking FRBR Entities to DBpedia},
        booktitle = {Joint Conference on Digital Libraries (JCDL)},
        year = {2011},
        publisher = {ACM},
        pages = {455-456},
        ee = {http://doi.acm.org/10.1145/1998076.1998183},
      }

    3. Supporting FRBRization of Web Product Descriptions
      Theory and Practice of Digital Libraries (TPDL), 2011
      Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg

      @inproceedings {tpdl11-frbr,
        author = {Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg},
        title = {Supporting FRBRization of Web Product Descriptions},
        booktitle = {Theory and Practice of Digital Libraries (TPDL)},
        publisher = {Springer},
        year = {2011},
        pages = {69-76},
        isbn = {978-3-642-24468-1},
      }

    4. Linking FRBR Entities to LOD through Semantic Matching
      Theory and Practice of Digital Libraries (TPDL), 2011
      Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg

      @inproceedings {tpdl11-lod,
        author = {Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg},
        title = {Linking FRBR Entities to LOD through Semantic Matching},
        booktitle = {Theory and Practice of Digital Libraries (TPDL)},
        publisher = {Springer},
        year = {2011},
        pages = {284-295},
        isbn = {978-3-642-24468-1},
      }

  • Logo FRBRizer
    FRBRizer

    Un outil de conversion des données bibliographiques au format MARC vers le modèle FRBR

    FRBRizer (aussi appelé marc2frbr) permet la conversion d'enregistrements bibliographiques au format MARC vers FRBR. Il utilise un ensemble de règles encodées dans un fichier XML. Un exemple de fichier de règles est fourni pour MARC21, mais FRBRizer est suffisament générique pour s'adapter aux autres dialectes de MARC. Plus de détails sur la page dédiée à FRBRizer.

    1. FRBR-ML: A FRBR-based Framework for Semantic Interoperability
      Journal of Semantic Web, 2012
      Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg and Maja Zumer

      @article {semweb12,
        author = {Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg and Maja Zumer},
        title = {FRBR-ML: A FRBR-based Framework for Semantic Interoperability},
        journal = {Journal of Semantic Web},
        publisher = {IOS Press},
        year = {2012},
        volume = {3},
        number = {1},
        month = {jan},
        url = {http://dx.doi.org/10.3233/SW-2012-0044},
        issn = {1570-0844},
        pages = {23-43},
      }

    2. FRBRPedia: a Tool for FRBRizing Web Products and Linking FRBR Entities to DBpedia
      Joint Conference on Digital Libraries (JCDL), 2011
      Fabien Duchateau and Naimdjon Takhirov and Trond Aalberg

      @inproceedings {jcdl11-demo,
        author = {Fabien Duchateau and Naimdjon Takhirov and Trond Aalberg},
        title = {FRBRPedia: a Tool for FRBRizing Web Products and Linking FRBR Entities to DBpedia},
        booktitle = {Joint Conference on Digital Libraries (JCDL)},
        year = {2011},
        publisher = {ACM},
        pages = {455-456},
        ee = {http://doi.acm.org/10.1145/1998076.1998183},
      }

    3. Supporting FRBRization of Web Product Descriptions
      Theory and Practice of Digital Libraries (TPDL), 2011
      Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg

      @inproceedings {tpdl11-frbr,
        author = {Naimdjon Takhirov and Fabien Duchateau and Trond Aalberg},
        title = {Supporting FRBRization of Web Product Descriptions},
        booktitle = {Theory and Practice of Digital Libraries (TPDL)},
        publisher = {Springer},
        year = {2011},
        pages = {69-76},
        isbn = {978-3-642-24468-1},
      }

  • Logo YAM
    YAM

    Une fabrique d'outils de mise en correspondance de schémas basée sur des techniques d'apprentissage pour combiner efficacement les mesures de similarité

    YAM (Yet Another Matcher) n'est pas (à nouveau) un autre outil de mise en correspondance de schémas. Il permet plutôt la génération de matchers à la carte, i.e., selon les besoins utilisateur. L'idée est de voir le problème d'appariement de schémas comme un problème de classification (correspondance ou non). Les besoins sont définis comme la préférence pour la précision ou le rappel, un jeu de données entraîné (exemples annotés), et des correspondances validées. YAM exploite une base de connaissances qui inclut un vaste ensemble de mesures de similarité et de classifieurs. En se basant sur les besoins utilisateur, YAM apprend une instance de classifieur qui combine les mesures de similarité de façon optimale afin d'obtenir la meilleure qualité d'appariement. Plus de détails sur la page dédiée à YAM.

    1. YAM: A Step Forward for Generating a Dedicated Schema Matcher
      Trans. Large-Scale Data- and Knowledge-Centered Systems (TLDKS), 2016
      Fabien Duchateau and Zohra Bellahsene

      @article {tldks2016,
        author = {Fabien Duchateau and Zohra Bellahsene},
        title = {YAM: A Step Forward for Generating a Dedicated Schema Matcher},
        journal = {Trans. Large-Scale Data- and Knowledge-Centered Systems (TLDKS)},
        volume = {25},
        pages = {150–185},
        year = {2016},
        url = {http://dx.doi.org/10.1007/978-3-662-49534-6_5},
        doi = {10.1007/978-3-662-49534-6_5},
      }

    2. (Not) Yet Another Matcher
      Conference on Information and Knowledge Management (CIKM), 2009
      Fabien Duchateau and Remi Coletta and Zohra Bellahsene and Renée J. Miller

      @inproceedings {cikm09,
        author = {Fabien Duchateau and Remi Coletta and Zohra Bellahsene and Renée J. Miller},
        title = {(Not) Yet Another Matcher},
        booktitle = {Conference on Information and Knowledge Management (CIKM)},
        year = {2009},
        pages = {1537-1540},
        ee = {http://doi.acm.org/10.1145/1645953.1646165},
        url = {http://doi.acm.org/10.1145/1645953.1646165},
        bibsource = {DBLP, http://dblp.uni-trier.de},
      }

    3. YAM: a Schema Matcher Factory
      Conference on Information and Knowledge Management (CIKM), 2009
      Fabien Duchateau and Remi Coletta and Zohra Bellahsene and Renée J. Miller

      @inproceedings {cikm09demo,
        author = {Fabien Duchateau and Remi Coletta and Zohra Bellahsene and Renée J. Miller},
        title = {YAM: a Schema Matcher Factory},
        booktitle = {Conference on Information and Knowledge Management (CIKM)},
        year = {2009},
        pages = {2079-2080},
        ee = {http://doi.acm.org/10.1145/1645953.1646311},
        url = {http://doi.acm.org/10.1145/1645953.1646311},
      }

    4. Encore un outil de découverte de correspondances entre schémas XML?
      Bases de Données Avancées (BDA), 2009
      Fabien Duchateau and Remi Coletta and Zohra Bellahsene and Renée J. Miller

      @inproceedings {bda09demo,
        author = {Fabien Duchateau and Remi Coletta and Zohra Bellahsene and Renée J. Miller},
        title = {Encore un outil de découverte de correspondances entre schémas XML?},
        booktitle = {Bases de Données Avancées (BDA)},
        year = {2009},
      }

  • Logo MatchPlanner
    MatchPlanner

    Un outil de mise en correspondance de schémas qui combine les mesures de similarité au moyen d'un arbre de décision

    MatchPlanner est un outil d'alignement de schémas qui utilise un arbre de décision pour combiner les mesures de similarité les plus pertinentes pour un domaine donné. Un premier avantage lié à l'arbre de décision est l'amélioration des performances du système puisque le nombre de mesures à exécuter est limité par la hauteur de l'arbre. Concernant la qualité des correspondances, seules les mesures les plus pertinentes sont utilisées, ce qui peut conduire à améliorer la qualité en ne privilégiant pas certaines catégories de mesures. Enfin MatchPlanner est capable d'apprendre de nouveaux arbres, permettant ainsi une configuration automatique du système pour un scénario donné. Plus de détails sur la page dédiée à MatchPlanner.

    1. A Flexible Approach for Planning Schema Matching Algorithms
      OTM Conferences, CooPerative Information Systems (CooPIS), 2008
      Fabien Duchateau and Zohra Bellahsene and Remi Coletta

      @inproceedings {coopis2008,
        author = {Fabien Duchateau and Zohra Bellahsene and Remi Coletta},
        title = {A Flexible Approach for Planning Schema Matching Algorithms},
        booktitle = {OTM Conferences, CooPerative Information Systems (CooPIS)},
        year = {2008},
        pages = {249-264},
        ee = {http://dx.doi.org/10.1007/978-3-540-88871-0_18},
        url = {http://dx.doi.org/10.1007/978-3-540-88871-0_18},
        bibsource = {DBLP, http://dblp.uni-trier.de},
      }

  • Logo XBenchMatch
    XBenchMatch

    Un benchmark pour évaluer les outils de mise en correspondance de schémas

    XBenchMatch est un benchmark (banc d'essai, i.e., jeux de données et métriques d'évaluation) pour tester, comparer et évaluer les outils de mise en correspondance de schémas. Les métriques portent sur la qualité (précision, rappel, f-score, mais également des métriques sur la complétude ou la minimalité des schémas intégrés) et les performances (temps d'exécution). Plusieurs jeux de données caractérisés sont fournis afin d'évaluer de nouveaux algorithmes. Plus de détails sur la page dédiée à XBenchMatch.

    1. Designing a Benchmark for the Assessment of Schema Matching Tools
      Open Journal of Databases (OJDB), 2014
      Fabien Duchateau and Zohra Bellahsene

      @inproceedings {ojdb14,
        author = {Fabien Duchateau and Zohra Bellahsene},
        title = {Designing a Benchmark for the Assessment of Schema Matching Tools},
        booktitle = {Open Journal of Databases (OJDB)},
        year = {2014},
        issn = {2199-3459},
        volume = {1},
        number = {1},
        pages = {3-25},
        url = {https://www.ronpub.com/OJDB-v1i1n02_Duchateau.pdf},
        publisher = {RonPub, Germany},
      }

    2. Matching and Alignment: What is the Cost of User Post-match Effort?
      OTM Conferences, CooPerative Information Systems (CooPIS), 2011
      Fabien Duchateau and Zohra Bellahsene and Remi Coletta

      @inproceedings {coopis11,
        author = {Fabien Duchateau and Zohra Bellahsene and Remi Coletta},
        title = {Matching and Alignment: What is the Cost of User Post-match Effort?},
        booktitle = {OTM Conferences, CooPerative Information Systems (CooPIS)},
        year = {2011},
        pages = {421-428},
        publisher = {Springer},
      }

    3. On Evaluating Schema Matching and Mapping
      Schema Matching and Mapping, 2011
      Angela Bonifati and Zohra Bellahsene and Fabien Duchateau and Yannis Velegrakis

      @inbook {BonifatiBFV2011,
        title = {On Evaluating Schema Matching and Mapping},
        booktitle = {Schema Matching and Mapping},
        publisher = {Data-Centric Systems and Applications, Springer},
        year = {2011},
        chapter = {9},
        pages = {253-291},
        url = {http://www.springer.com/computer/book/978-3-642-16517-7},
        author = {Angela Bonifati and Zohra Bellahsene and Fabien Duchateau and Yannis Velegrakis},
      }

    4. Measuring the Quality of an Integrated Schema
      Conference on Conceptual Modelling (ER), 2010
      Fabien Duchateau and Zohra Bellahsene

      @inproceedings {er2010,
        author = {Fabien Duchateau and Zohra Bellahsene},
        title = {Measuring the Quality of an Integrated Schema},
        booktitle = {Conference on Conceptual Modelling (ER)},
        year = {2010},
        pages = {261-273},
        ee = {http://dx.doi.org/10.1007/978-3-642-16373-9_19},
        url = {http://dx.doi.org/10.1007/978-3-642-16373-9_19},
        bibsource = {DBLP, http://dblp.uni-trier.de},
      }

    5. XBenchMatch: a Benchmark for XML Schema Matching Tools
      Very Large DataBases (VLDB), 2007
      Fabien Duchateau and Zohra Bellahsene and Ela Hunt

      @inproceedings {vldb2007demo,
        author = {Fabien Duchateau and Zohra Bellahsene and Ela Hunt},
        title = {XBenchMatch: a Benchmark for XML Schema Matching Tools},
        booktitle = {Very Large DataBases (VLDB)},
        year = {2007},
        pages = {1318-1321},
        ee = {http://www.vldb.org/conf/2007/papers/demo/p1318-duchateau.pdf},
        url = {http://www.vldb.org/conf/2007/papers/demo/p1318-duchateau.pdf},
      }

  • Logo BMatch
    BMatch

    Un outil de mise en correspondance de schémas qui implémente une mesure de similarité structurelle et un arbre B- comme structure d'indexation

    BMatch est un outil de découverte de correspondances entre schémas XML, qui combine des mesures de similarité terminologique et structurelles. Les mesures terminologiques détectent des éléments avec des libellés similaires tandis que la mesure structurelle repose sur une comparaison du voisinage (calcul via la mesure cosinus). Un autre aspect de BMatch concerne l'amélioration des performances (temps d'exécution) par l'implémentation d'une structure d'indexation, l'arbre B-, pour accélérer la détection de corresponances. En effet, l'espace de recherche est réduit grâce au regroupement des éléments partageant des sous-ensembles (tokens) de libellés. Plus de détails sur la page dédiée à BMatch.

    1. Improving quality and performance of schema matching in large scale
      Ingénierie des Systèmes d'Information (ISI), 2008
      Fabien Duchateau and Zohra Bellahsene and Mathieu Roche

      @article {isi2008,
        author = {Fabien Duchateau and Zohra Bellahsene and Mathieu Roche},
        title = {Improving quality and performance of schema matching in large scale},
        journal = {Ingénierie des Systèmes d'Information (ISI)},
        volume = {13},
        number = {5},
        year = {2008},
        pages = {59-82},
        ee = {http://dx.doi.org/10.3166/isi.13.5.59-82},
        url = {http://dx.doi.org/10.3166/isi.13.5.59-82},
        bibsource = {DBLP, http://dblp.uni-trier.de},
      }

    2. A Context-based Measure for Discovering Approximate Semantic Matching between Schema Elements
      Research Challenges in Information Science (RCIS), 2007
      Fabien Duchateau and Zohra Bellahsene and Mathieu Roche

      @inproceedings {rcis2007,
        author = {Fabien Duchateau and Zohra Bellahsene and Mathieu Roche},
        title = {A Context-based Measure for Discovering Approximate Semantic Matching between Schema Elements},
        booktitle = {Research Challenges in Information Science (RCIS)},
        year = {2007},
        pages = {9-20},
        bibsource = {DBLP, http://dblp.uni-trier.de},
      }

    3. An Indexing Structure for Automatic Schema Matching
      International Conference on Data Engineering (ICDE) - Workshops, 2007
      Fabien Duchateau and Zohra Bellahsene and Mark Roantree and Mathieu Roche

      @inproceedings {smdb2007,
        author = {Fabien Duchateau and Zohra Bellahsene and Mark Roantree and Mathieu Roche},
        title = {An Indexing Structure for Automatic Schema Matching},
        booktitle = {International Conference on Data Engineering (ICDE) - Workshops},
        year = {2007},
        pages = {485-491},
        ee = {http://dx.doi.org/10.1109/ICDEW.2007.4401032},
        url = {http://dx.doi.org/10.1109/ICDEW.2007.4401032},
        bibsource = {DBLP, http://dblp.uni-trier.de},
      }

    4. BMatch: a Semantically Context-based Tool Enhanced by an Indexing Structure to Accelerate Schema Matching
      Base de Données Avancées (BDA), 2007
      Fabien Duchateau and Zohra Bellahsene and Mathieu Roche

      @inproceedings {bda2007,
        author = {Fabien Duchateau and Zohra Bellahsene and Mathieu Roche},
        title = {BMatch: a Semantically Context-based Tool Enhanced by an Indexing Structure to Accelerate Schema Matching},
        booktitle = {Base de Données Avancées (BDA)},
        year = {2007},
        bibsource = {DBLP, http://dblp.uni-trier.de},
      }