Web de données§

author:Pierre-Antoine Champin

Contrat Creative Commons

1

Motivation et historique§

2

Le Web vu par Tim Berners-Lee (1989)§

« Vague, but exciting »

3

Web de ressources§

Le web est constitué de ressources, par exemple :

  • le bulletin météo du jour pour Lyon
  • le bulletin météo du jour pour le lieu courant
  • ma commande de café de jeudi dernier

Chaque ressource est identifiée par un IRI (Internationalized Resource Identifier), e.g.:

⚠ Un IRI n'est pas un nom de fichier (cf. exemples ci-dessus)

4

Parenthèse : URL/URI/IRI§

5

Ressources et représentations§

représentation : utilisable par :
texte humains, moteurs de recherche
médias (image, son...) surtout humains
données structurées machines
6

De HTML à XML§

XML (eXtensible Markup Language) a été recommandé par le W3C en 1998. L'objectif était de pallier la sémantique « faible » de HTML.

<!-- HTML -->
<a href="http://champin.net/">
  Pierre-Antoine <strong>Champin</strong>
  (<em>Maître de conférences</em>)</a>
<!-- XML -->
<Person homepage="http://champin.net/">
  <givenName>Pierre-Antoine</givenName>
  <surname>Champin</surname>
  <job>Maître de conférences</job></Person>
7

XML et la sémantique§

On a dit tout et son contraire l'apport sémantique de XML :

Les deux ont leur part de vérité.

8

XML a plus de sémantique que HTML...§

... dans le sens ou il est extensible : on peut donc exprimer des choses que HTML ne permet pas d'exprimer (e.g.``<givenName>``).

<Person xmlns="http://xmlns.com/foaf/0.1/"
        xmlns:pro="http://example.com/"
     homepage="http://champin.net/">
  <givenName>Pierre-Antoine</givenName>
  <surname>Champin</surname>
  <pro:job>Maître de conférence</pro:job></Person>
9

XML a moins de sémantique que HTML...§

... dans la mesure ou :

10

XML : apports et limitations§

Le surplus de sémantique promis par XML n'est donc pas « magique » : il suppose

11

XML : apports et limitations (suite)§

L'apport est donc essentiellement technique : la base commune de XML permet de factoriser les efforts de développement et d'apprentissage :

12

De XML à RDF§

13

De RDF à RDF§

14

Le mouvement OpenData§

Toute donnée publique (gouvernementale, ONU) ou publiée (scientifique) devrait être accessible sous une forme permettant le traitement automatique (en plus d'une forme lisible pour des humains).

15

Linked Open Data§

16

Les quatre principes de Linked Data§

d'après Tim Berners-Lee, http://www.w3.org/DesignIssues/LinkedData.html

17

Ouvrir les données liées§

18

Projet emblématique : DBpedia§

19

Informations structurées dans Wikipedia§

20

Le « LOD cloud »§

21

Le « LOD cloud »§

22

Le « LOD cloud »§

23

Le « LOD cloud »§

24

Le « LOD cloud »§

25

Rechercher et explotation des données§

26

Divergences et convergences§

27