RDF§

Introduction§

Des données aux données liées§

_images/data_model1.svg

Données classiques...

_images/data_model2.svg

vues comme un graphe... (uniformité)

_images/data_model3.svg

avec des IRIS. (désambiguation)

Note

Ces trois diagrammes représentent la même information, même si le premier est beaucoup plus lisible pour l’humain que le troisième.

RDF mets l’accent sur la lisibilité par les machines, on se focalise donc plus sur la structure du troisième schéma, mais cette complexité apparente est surtout une question de présentation.

Vue d’ensemble§

RDF définit :

  • une syntaxe abstraite (modèle de donnée),
  • une sémantique pour interpréter la syntaxe abstraite,
  • plusieurs syntaxes concrètes pour représenter/échanger la syntaxe abstraite.

Syntaxe abstraite et sémantique§

Triplet§

Toute information en RDF est représentée par un triplet,

signifiant qu’une chose est en relation avec une autre.

Exemple :

Le laboratoire LIRIS (sujet)

a pour membre (prédicat)

Pierre-Antoine Champin (objet)

Nommage§

Les choses sont nommées par des IRIs :

On peut représenter ceci graphiquement :

digraph t_uri {
margin=0;
bgcolor="#FFFFFF00";
node [ style=filled,color=black,fillcolor=white ];

liris [ label="http://liris.cnrs.fr/#lab" ];
pa [ label="http://champin.net/#pa" ];
liris -> pa [ label="http://xmlns.com/foaf/0.1/member" ];
}
Remarque§

Dans RDF, les URIs ne sont utilisés que comme des identifiants opaques.

Les représentations qui sont éventuellement accessibles via ces URIs (par déréférencement) n’ont aucune influence sur leur sémantique.

Notons que le mouvement Linked Data préconise une utilisation particulière des URIs dans laquelle les réprésentations doivent être cohérentes avec la sémantique. Cependant cette contrainte n’est pas inhérente à RDF.

Préfixes§

Pour simplifier les notations, on définit des préfixes courts correspondant à des préfixes d’IRI :

liris: → http://liris.cnrs.fr/#

foaf: → http://xmlns.com/foaf/0.1/

champin: → http://champin.net/#

On utilise ensuite des noms préfixés :

liris:lab foaf:member champin:pa

et également sous forme graphique :

digraph t_prefixed {
margin=0; rankdir=LR;
bgcolor="#FFFFFF00";
node [ style=filled,color=black,fillcolor=white ];

liris [ label="liris:lab" ]
pa [ label="champin:pa" ]
liris -> pa [ label="foaf:member" ]
}

Littéraux§

On peut également lier une ressource à une donnée typée (chaîne de caractère, entier, réel...), nommée un littéral.

champin:pa foaf:name "Pierre-Antoine Champin"

Traditionnellement, on représente les littéraux par des nœuds rectangulaires :

digraph t_literal {
margin=0; rankdir=LR;
bgcolor="#FFFFFF00";
node [ style=filled,color=black,fillcolor=white ];

pa [ label="champin:pa" ]
name [ label="Pierre-Antoine Champin", shape=box ]
pa -> name [ label="foaf:name" ]
}

Nœuds muets§

Enfin, RDF permet de parler d’une ressource sans connaître son IRI. Cela revient en logique à utiliser une variable quantifiée existentiellement.

(quelque chose) foaf:name "Stéphane Derrode"

On parle alors de nœud muet (par analogie aux variables muettes).

Graphiquement, on représente cette ressource par un nœud vierge (blank node).

digraph t_bnode {
margin=0; rankdir=LR;
bgcolor="#FFFFFF00";
node [ style=filled,color=black,fillcolor=white ];

am [ label="" ]
name [ label="Stéphane Derrode", shape=box ]
am -> name [ label="foaf:name" ]
}

Exemple de graphe§

Un ensemble de triplets forme un graphe orienté étiqueté.

digraph graphe1 {
margin=0;

foaf_person [ label="foaf:Person" ]
foaf_group [ label="foaf:Group" ]
liris [ label="liris:lab" ]
pa [ label="champin:pa" ]
am [ label="" ]
pa_name [ label="Pierre-Antoine Champin", shape=box ]
am_name [ label="Stéphane Derrode", shape=box ]

liris -> foaf_group [ label="rdf:type" ]
pa -> foaf_person [ label="rdf:type" ]
am -> foaf_person [ label="rdf:type" ]
liris -> pa [ label="foaf:member" ]
liris -> am [ label="foaf:member" ]
pa -> pa_name [ label="foaf:name" ]
am -> am_name [ label="foaf:name" ]
am -> pa [ label="foaf:knows" ]
}

Sémantique et inférences§

En informatique, la sémantique d’un langage est souvent définie par les inférences (déductions) qu’on peut faire avec ce langage.

La structure du graphe permet de faire un minimum d’inférence, sans même avoir besoin de connaître le vocabulaire.

Indice

Par analogie, de l’arbre XML <a b="foo" c="bar"/>, on peut « inférer » l’arbre <a c="bar" b="foo"/> sans même connaître la sémantique des balises ou des attributs, car l’ordre des attributs n’est pas significatif.

Monotonie§

On peut déduire d’un graphe n’importe quel sous-graphe.

Si :

digraph monotonie_premisse {
margin=0; rankdir=LR; label="« riri a pour frère fifi et loulou »"
bgcolor="#FFFFFF00";
node [ style=filled,color=black,fillcolor=white ];

riri [ label=":riri" ]
fifi [ label=":fifi" ]
loulou [ label=":loulou" ]
riri -> fifi [ label=":frère" ]
riri -> loulou [ label=":frère" ]
}

alors :

digraph monotonie_consequence {
margin=0; rankdir=LR; label="« riri a pour frère loulou »"
bgcolor="#FFFFFF00";
node [ style=filled,color=black,fillcolor=white ];

riri [ label=":riri" ]
loulou [ label=":loulou" ]
riri -> loulou [ label=":frère" ]
}

Anonymisation§

On peut remplacer n’importe quel nœud par un nœud muet.

Si :

digraph anonymisation_premisse {
margin=0; rankdir=LR; label="« riri a pour frère fifi et loulou »"
bgcolor="#FFFFFF00";
node [ style=filled,color=black,fillcolor=white ];

riri [ label=":riri" ]
fifi [ label=":fifi" ]
loulou [ label=":loulou" ]
riri -> fifi [ label=":frère" ]
riri -> loulou [ label=":frère" ]
}

alors :

digraph anonymisation_consequence {
margin=0; rankdir=LR; label="« quelque chose a pour frère fifi et loulou »"
bgcolor="#FFFFFF00";
node [ style=filled,color=black,fillcolor=white ];

riri [ label="" ]
fifi [ label=":fifi" ]
loulou [ label=":loulou" ]
riri -> fifi [ label=":frère" ]
riri -> loulou [ label=":frère" ]
}

Éclatement§

On peut « éclater » n’importe quel nœud muet.

Si :

digraph anonymisation_consequence {
margin=0; rankdir=LR; label="« quelque chose a pour frère fifi et loulou »"
bgcolor="#FFFFFF00";
node [ style=filled,color=black,fillcolor=white ];

riri [ label="" ]
fifi [ label=":fifi" ]
loulou [ label=":loulou" ]
riri -> fifi [ label=":frère" ]
riri -> loulou [ label=":frère" ]
}

alors :

digraph anonymisation_consequence {
margin=0; rankdir=LR;
label="« quelque chose a pour frère fifi, et\nquelque chose a pour frère loulou »";
bgcolor="#FFFFFF00";
node [ style=filled,color=black,fillcolor=white ];

riri1 [ label="" ]
riri2 [ label="" ]
fifi [ label=":fifi" ]
loulou [ label=":loulou" ]
riri1 -> fifi [ label=":frère" ]
riri2 -> loulou [ label=":frère" ]
}

Inférences supplémentaires§

Bien sûr, des inférences supplémentaires peuvent être faites en prêtant une sémantique particulière aux IRIs utilisés dans le graphe.

Par exemple, si :

digraph monotonie_premisse {
margin=0; rankdir=LR; label="« riri a pour frère fifi et loulou »"
bgcolor="#FFFFFF00";
node [ style=filled,color=black,fillcolor=white ];

riri [ label=":riri" ]
fifi [ label=":fifi" ]
loulou [ label=":loulou" ]
riri -> fifi [ label=":frère" ]
riri -> loulou [ label=":frère" ]
}

et si frère est connnue pour être une relation symétrique et transitive, alors (entre autres) :

digraph monotonie_consequence {
margin=0; rankdir=LR; label="« fifi a pour frère loulou »"
bgcolor="#FFFFFF00";
node [ style=filled,color=black,fillcolor=white ];

fifi [ label=":fifi" ]
loulou [ label=":loulou" ]
fifi -> loulou [ label=":frère" ]
}

Vocabulaire et sémantique additionelle§

On verra plus tard des langages (RDF-Schema, OWL) permettant de définit la sémantique de certains IRIs.

Mais ces langages ne peuvent pas remettre en cause les inférences présentées ci-avant.

Indice

Analogie : lorsqu’on définit un format XML, on prête une sémantique particulière aux éléments et attributs de ce format, mais on ne peut pas prêter de sémantique à l’ordre des attributs ;

  • sémantiquement, ce ne serait plus du XML,
  • pragmatiquement, les outils standards (analyseur syntaxique, sérialiseurs) ne permettraient pas de contrôler cet aspect de la syntaxe.

Syntaxes concrètes§

Note

Dans cette section, on illustre chacune des syntaxes concrères avec l’exemple de graphe donné plus haut.

RDF/XML§

  • syntaxe originale recommandée par le W3C (1999)
  • basée sur XML
  • relativement complexe et verbeuse
Syntaxe:http://www.w3.org/TR/rdf-syntax-grammar/
Valideur:http://www.w3.org/RDF/Validator/

RDF/XML : exemple§

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
         xmlns:foaf="http://xmlns.com/foaf/0.1/"                          >
 <foaf:Group rdf:about="http://liris.cnrs.fr/#lab">
  <foaf:member>
   <foaf:Person>
    <foaf:name>Stéphane Derrode</foaf:name>
    <foaf:knows
     rdf:resource="http://champin.net/#pa"/>
   </foaf:Person>
  </foaf:member>
  <foaf:member>
   <foaf:Person rdf:about="http://champin.net/#pa">
    <foaf:name>Pierre-Antoine Champin</foaf:name>
   </foaf:Person>
  </foaf:member>
  </foaf:Group>
</rdf:RDF>

Turtle : Terse RDF Triple Language§

  • dérivée du langage N3
  • adoptée dans RDF 1.1 en 2014
  • vise la simplicité et la compacité
Syntaxe:http://www.w3.org/TR/turtle/
Valideur:http://www.rdfabout.com/demo/validator/

Turtle: exemple§

@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix champin: <http://champin.net/#> .

liris:lab
    a foaf:Group ;
    foaf:member champin:pa, _:sd .
champin:pa
    a foaf:Person ;
    foaf:name "Pierre-Antoine Champin" .
_:sd
    a foaf:Person ;
    foaf:name "Stéphane Derrode" ;
    foaf:knows champin:pa .

Turtle: exemple 2§

@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix champin: <http://champin.net/#> .

liris:lab
    a foaf:Group ;
    foaf:member champin:pa, [
      a foaf:Person ;
      foaf:name "Stéphane Derrode" ;
      foaf:knows champin:pa .
    ] .
champin:pa
    a foaf:Person ;
    foaf:name "Pierre-Antoine Champin" .

RDFa : RDF in attributes§

RDFa est une utilisation d’attributs (existants ou supplémentaires) de (X)HTML pour y inclure du RDF (à la manière des micro-formats) :

  • facilite la migration de contenus HTML vers RDF
  • facilite la maintenance en cohérence de la version HTML et des données RDF (DRY : Don’t Repeat Yourself)
Syntaxe:http://www.w3.org/TR/rdfa-primer/
Valideur:http://check.rdfa.info/
Distiller:http://www.w3.org/2012/pyRdfa/

RDFa : exemple§

<p prefix="foaf http://xmlns.com/foaf/0.1/"
   about="_:sd">
  <span property="foaf:name"
    >Stéphane Derrode</span>
  est membre du
  <a rev="foaf:member" href="http://liris.cnrs.fr/#lab"
    >LIRIS</a>.
  Il connaît
  <span rel="foaf:knows" href="http://champin.net/#pa">
    <span property="foaf:name"
      >Pierre-Antoine Champin</span>,
    un autre membre de
    <span rev="foaf:member" href="http://liris.cnrs.fr/#lab">
      ce laboratoire.</span>
  </span> </p>

JSON-LD§

  • Rappel : JSON est un langage d’échange de données, basé sur Javascript, et très utilisé en développement web.
  • JSON-LD (JSON Linked Data) permet d’interpréter une structure JSON comme du RDF,
  • grâce à un contexte (implicite ou explicite).
  • Objectif : faciliter l’adoption de RDF (syntaxe abstraite) auprès des développeurs d’applications web.
Syntaxe:http://www.w3.org/TR/json-ld-syntax/
Valideur:http://json-ld.org/playground/

JSON-LD: exemple§

{ "@context" : { /* ... */                                   },
 "@id": "http://liris.cnrs.fr/#lab",
 "@type": "Group",
 "member": [
   {
     "@id": "http://champin.net/#pa",
     "@type": "Person",
     "name": "Pierre-Antoine Champin"
   },
   {
     "@type": "Person",
     "name": "Stéphane Derrode",
     "knows": "http://champin.net/#pa"
   }
 ]
}

Autres syntaxes§

  • Comme l’illustrent RDFa et JSON-LD, tout langage peut être interprété comme du RDF:
  • ← Prépondérance de la syntaxe abstraite.
  • Difficulté : faire correspondre des IRIs là où d’autres langages utilisent des termes « locaux ».