RDF¶
Introduction¶
Des données aux données liées¶
Note
Ces trois diagrammes représentent la même information, même si le premier est beaucoup plus lisible pour l’humain que le troisième.
RDF mets l’accent sur la lisibilité par les machines, on se focalise donc plus sur la structure du troisième schéma, mais cette complexité apparente est surtout une question de présentation.
Vue d’ensemble¶
RDF définit :
une syntaxe abstraite (modèle de donnée),
une sémantique pour interpréter la syntaxe abstraite,
plusieurs syntaxes concrètes pour représenter/échanger la syntaxe abstraite.
Syntaxe abstraite et sémantique¶
Triplet¶
Toute information en RDF est représentée par un triplet,
signifiant qu’une chose est en relation avec une autre.
Exemple :
Le laboratoire LIRIS (sujet)
a pour membre (prédicat)
Pierre-Antoine Champin (objet)
Nommage¶
Les choses sont nommées par des IRIs :
On peut représenter ceci graphiquement :
Remarque¶
Dans RDF, les URIs ne sont utilisés que comme des identifiants opaques.
Les représentations qui sont éventuellement accessibles via ces URIs (par déréférencement) n’ont aucune influence sur leur sémantique.
Notons que le mouvement Linked Data préconise une utilisation particulière des URIs dans laquelle les réprésentations doivent être cohérentes avec la sémantique. Cependant cette contrainte n’est pas inhérente à RDF.
Préfixes¶
Pour simplifier les notations, on définit des préfixes courts correspondant à des préfixes d’IRI :
liris: →
http://liris.cnrs.fr/#
foaf: →
http://xmlns.com/foaf/0.1/
champin: →
http://champin.net/#
On utilise ensuite des noms préfixés :
liris:lab foaf:member champin:pa
et également sous forme graphique :
Littéraux¶
On peut également lier une ressource à une donnée typée (chaîne de caractère, entier, réel…), nommée un littéral.
champin:pa foaf:name "Pierre-Antoine Champin"
Traditionnellement, on représente les littéraux par des nœuds rectangulaires :
Nœuds muets¶
Enfin, RDF permet de parler d’une ressource sans connaître son IRI. Cela revient en logique à utiliser une variable quantifiée existentiellement.
(quelque chose) foaf:name "Stéphane Derrode"
On parle alors de nœud muet (par analogie aux variables muettes).
Graphiquement, on représente cette ressource par un nœud vierge (blank node).
Exemple de graphe¶
Un ensemble de triplets forme un graphe orienté étiqueté.
Sémantique et inférences¶
En informatique, la sémantique d’un langage est souvent définie par les inférences (déductions) qu’on peut faire avec ce langage.
La structure du graphe permet de faire un minimum d’inférence, sans même avoir besoin de connaître le vocabulaire.
Indication
Par analogie, de l’arbre XML <a b="foo" c="bar"/>
,
on peut « inférer » l’arbre <a c="bar" b="foo"/>
sans même connaître la sémantique des balises ou des attributs,
car l’ordre des attributs n’est pas significatif.
Monotonie¶
On peut déduire d’un graphe n’importe quel sous-graphe.
Si :
alors :
Hypothèse du monde ouvert (OWA)¶
Un triplet qui n’est pas donné n’est pas considéré comme faux, mais comme inconnue (i.e. peut-être vrai, peut-être faux).
On ne peut donc rien déduire de l”absence d’un triplet / d’une information.
→ dans le contexte du Web, l’information dont on dispose est toujours partielle.
Conséquence de la monotonie et de l”OWA¶
Exemple : Arthur peut-il voler ? Sachant que :
Arthur est un animal
Arthur est un oiseau
Arthur est une autruche
→ la sémantique de RDF ne peut pas capturer la notion de valeur par défaut
(e.g. «Les oiseaux volent (en général). Les autruches sont des oiseaux qui ne volent pas.»)
Note
Il existe des systèmes de logique capable de gérer des valeurs par défaut.
Mais pour RDF, le choix a été fait de se baser sur la logique classique.
Anonymisation¶
On peut remplacer n’importe quel nœud par un nœud muet.
Si :
alors :
Éclatement¶
On peut « éclater » n’importe quel nœud muet.
Si :
alors :
Inférences supplémentaires¶
Bien sûr, des inférences supplémentaires peuvent être faites en prêtant une sémantique particulière aux IRIs utilisés dans le graphe.
Par exemple, si :
et si frère est connnue pour être une relation symétrique et transitive, alors (entre autres) :
Vocabulaire et sémantique additionelle¶
On verra plus tard des langages (RDF-Schema, OWL) permettant de définit la sémantique de certains IRIs.
Mais ces langages ne peuvent pas remettre en cause les inférences présentées ci-avant.
Indication
Analogie : lorsqu’on définit un format XML, on prête une sémantique particulière aux éléments et attributs de ce format, mais on ne peut pas prêter de sémantique à l’ordre des attributs ;
sémantiquement, ce ne serait plus du XML,
pragmatiquement, les outils standards (analyseur syntaxique, sérialiseurs) ne permettraient pas de contrôler cet aspect de la syntaxe.
Syntaxes concrètes¶
Note
Dans cette section, on illustre chacune des syntaxes concrères avec l’exemple de graphe donné plus haut.
RDF/XML¶
syntaxe originale recommandée par le W3C (1999)
basée sur XML
relativement complexe et verbeuse
- Syntaxe:
- Valideur:
RDF/XML : exemple¶
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:foaf="http://xmlns.com/foaf/0.1/" >
<foaf:Group rdf:about="http://liris.cnrs.fr/#lab">
<foaf:member>
<foaf:Person>
<foaf:name>Stéphane Derrode</foaf:name>
<foaf:knows
rdf:resource="http://champin.net/#pa"/>
</foaf:Person>
</foaf:member>
<foaf:member>
<foaf:Person rdf:about="http://champin.net/#pa">
<foaf:name>Pierre-Antoine Champin</foaf:name>
</foaf:Person>
</foaf:member>
</foaf:Group>
</rdf:RDF>
Turtle : Terse RDF Triple Language¶
dérivée du langage N3
adoptée dans RDF 1.1 en 2014
vise la simplicité et la compacité
- Syntaxe:
- Valideur:
Turtle: exemple¶
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX champin: <http://champin.net/#>
liris:lab
a foaf:Group ;
foaf:member champin:pa, _:sd .
champin:pa
a foaf:Person ;
foaf:name "Pierre-Antoine Champin" .
_:sd
a foaf:Person ;
foaf:name "Stéphane Derrode" ;
foaf:knows champin:pa .
Turtle: exemple 2¶
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX champin: <http://champin.net/#>
liris:lab
a foaf:Group ;
foaf:member champin:pa, [
a foaf:Person ;
foaf:name "Stéphane Derrode" ;
foaf:knows champin:pa .
] .
champin:pa
a foaf:Person ;
foaf:name "Pierre-Antoine Champin" .
RDFa : RDF in attributes¶
RDFa est une utilisation d’attributs (existants ou supplémentaires) de (X)HTML pour y inclure du RDF (à la manière des micro-formats) :
facilite la migration de contenus HTML vers RDF
facilite la maintenance en cohérence de la version HTML et des données RDF (DRY : Don’t Repeat Yourself)
- Syntaxe:
- Valideur:
- Distiller:
RDFa : exemple¶
<p prefix="foaf http://xmlns.com/foaf/0.1/"
about="_:sd">
<span property="foaf:name"
>Stéphane Derrode</span>
est membre du
<a rev="foaf:member" href="http://liris.cnrs.fr/#lab"
>LIRIS</a>.
Il connaît
<span rel="foaf:knows" href="http://champin.net/#pa">
<span property="foaf:name"
>Pierre-Antoine Champin</span>,
un autre membre de
<span rev="foaf:member" href="http://liris.cnrs.fr/#lab">
ce laboratoire.</span>
</span> </p>
JSON-LD¶
Rappel : JSON est un langage d’échange de données, basé sur Javascript, et très utilisé en développement web.
JSON-LD (JSON Linked Data) permet d’interpréter une structure JSON comme du RDF,
grâce à un contexte (implicite ou explicite).
Objectif : faciliter l’adoption de RDF (syntaxe abstraite) auprès des développeurs d’applications web.
- Syntaxe:
- Valideur:
JSON-LD: exemple¶
{ "@context" : { /* ... */ },
"@id": "http://liris.cnrs.fr/#lab",
"@type": "Group",
"member": [
{
"@id": "http://champin.net/#pa",
"@type": "Person",
"name": "Pierre-Antoine Champin"
},
{
"@type": "Person",
"name": "Stéphane Derrode",
"knows": "http://champin.net/#pa"
}
]
}
Autres syntaxes¶
Comme l’illustrent RDFa et JSON-LD, tout langage peut être interprété comme du RDF:
dialectes en XML (GRDDL)
CSV (CSV on the Web)
microformats (http://http://microformats.org/)
microdata (http://www.data-vocabulary.org/)
← Prépondérance de la syntaxe abstraite.
cf. chapitre Publier des données liées
Difficulté : faire correspondre des IRIs là où d’autres langages utilisent des termes « locaux ».
Extensions¶
RDF*¶
RDF* est une extension de RDF proposée par Olaf Hartig, dans laquelle les triplets sont des objets de premier niveau, qui peuvent à leur tour être sujet ou objet d’un triplet.
liris:lab foaf:member champin:pa.
<<liris:lab foaf:member champin:pa>> :as "Associate professor";
:since "2003-09-01"^^xsd:dateTime.
Cette possibilité d’annoter les arcs existe dans les bases de données graphes telle que Neo4J. RDF* cherche à créer une convergence entre le Web Sémantique et ces bases de données.