Le protocole HTTP et WSGI§

1

Rappels sur le Web§

2

Web ≠ Internet§

Internet est ensemble de réseaux informatiques locaux utilisant les mêmes protocoles de bas niveau standards (TCP/IP) et formant un réseau global.

../_images/InternetMonde.png

Image © portices.fr

Note

Le Web est l'une des applications d'internet, et la plus populaire, d'où l'amalgamme souvent fait entre les deux.

3

Qu'est-ce que le Web ?§

Un espace documentaire décentralisé, interconnecté et interopérable.

Note

Ces technologies peuvent bien sûr évoluer (elle l'ont déjà fait), voire être à terme remplacées par d'autres. Ce ne sont pas elles qui définissent le Web, mais les 3 propriétés qu'elles lui confèrent.

4

Architecture du Web§

5

Architecture Client-Serveur§

Note

  • Les termes "client" et "serveur" identifient en fait des rôles.
  • Le même ordinateur peut jouer le rôle de client dans certaines situations, et de serveur dans d'autres situations.
  • Il est même possible d'avoir, sur un même ordinateur, un logiciel client et un logiciel serveur (c'est ce que nous ferons en TP).
6

Identification des ressources§

 ┌──────────────────── protocole
 │      ┌───────────── serveur
 │      │           ┌─ nom local
 │      │           │
─┴──   ─┴───────── ─┴──────────────
http://champin.net/enseignement/web

Avertissement

Malgré cette similitude, les ressources ne correspondent pas toujours à des fichiers.

7

Identification des ressources§

 ┌──────────────────── protocole
 │      ┌───────────── serveur
 │      │           ┌─ nom local
 │      │           │
─┴──   ─┴───────── ─┴───────────╌╌
http://champin.net/a/b/c?d=1&e=2#f
                   ───┬─ ─────┬─ ┬
                      │       │  │
partie hiérarchique   │       │  │
            (chemin) ─┘       │  │
 partie associative           │  │
        (paramètres) ─────────┘  │
     partie interne(fragment) ────────────┘
8

Rôles du serveur§

Important

L'état d'une ressource n'est pas forcément stocké dans un fichier. Souvent, il est stocké dans une base de données ; la représentation HTML (ou autre) de la ressource est calculée par le serveur.

9

Rôles du client§

10

Message HTTP§

11

Principe§

HTTP est basé sur l'échange de messages :

Chaque échange est indépendant des autres (messages auto-suffisants).

12

Structure générale§

../_images/envelope.svg
13

Structure d'une requête§

14

Exemples de requêtes§

GET /france/lyon HTTP/1.1
Host: meteo.example.org
User-Agent: Mozilla/5.0 (X11; Linux x86_64;
       rv:58.0) Gecko/20100101 Firefox/58.0
Accept: text/html,application/xhtml+xml,
       application/xml;q=0.9,*/*;q=0.8
Accept-Language: fr,en;q=0.5
Accept-Encoding: gzip,deflate
Accept-Charset: UTF-8,*
Connection: keep-alive
Keep-Alive: 300

(pas de contenu)

15

Exemples de requêtes (2)§

GET /france?ville=lyon HTTP/1.1
Host: meteo.example.org
User-Agent: Mozilla/5.0 (X11; Linux x86_64;
       rv:58.0) Gecko/20100101 Firefox/58.0
Accept: text/html,application/xhtml+xml,
      application/xml;q=0.9,*/*;q=0.8
Accept-Language: fr,en;q=0.5
Accept-Encoding: gzip,deflate
Accept-Charset: UTF-8,*
Connection: keep-alive
Keep-Alive: 300

(pas de contenu)

16

Exemples de requêtes (3)§

POST /passer-commande HTTP/1.1
Host: marchand.example.org
User-Agent: Mozilla/5.0 (X11; Linux x86_64;
       rv:58.0) Gecko/20100101 Firefox/58.0
Accept: text/html,application/xhtml+xml,
       application/xml;q=0.9,*/*;q=0.8
Accept-Language: fr,en;q=0.5
Accept-Encoding: gzip,deflate
Accept-Charset: UTF-8,*
Connection: keep-alive
Keep-Alive: 300
Content-Type: application/x-www-form-urlencoded
Content-Length: 12345

nom=PA+Champin&addresse=12+rue+Turing&articles=...

Note

  • On retrouve dans la requête la structure de l'URL (nom du serveur, nom local de la ressource)
  • Notez que les deux premières requêtes sont identiques, à l'exception du nom local.
17

Structure d'une réponse§

18

Exemples de réponse§

HTTP/1.1 200 OK
Date: Mon, 02 Jan 2016 22:46:26 GMT
Server: Apache/2
Accept-Ranges: bytes
Content-Type: text/html; charset=utf-8
Content-Length: 29794
Etag: "7462-477341dcfb940;89-3f26bd17a2f00"
Last-Modified: Mon, 02 Jan 2016 12:00:00 GMT
Content-Location: Home.html
Vary: negotiate,accept
Cache-Control: max-age=600
Expires: Mon, 02 Nov 2009 22:56:26 GMT
Connection: close

<!DOCTYPE html>
<html><head><title>Météo de Lyon</title>
...
19

Exemples de réponse (2)§

HTTP/1.1 303 See also
Date: Mon, 02 Jan 2016 22:46:26 GMT
Server: Apache/2
Accept-Ranges: bytes
Location: /commande/12345
Connection: close

(pas de contenu)
20

Exemples de réponse (3)§

HTTP/1.1 404 Not Found
Date: Mon, 02 Jan 2016 22:46:26 GMT
Server: Apache/2
Content-Type: text/html; charset=utf-8
Content-Length: 2979http://rdflib.readthedocs.io/
Connection: close

<!DOCTYPE html>
<html><head><title>Cette ressource n'existe pas</title>
...
21

Codes de statut§

HTTP définit 40 codes de statut, répartis en cinq catégories :

Catégories Exemples
1xx : Information 100 Continue
2xx : Succès 200 OK
3xx : Redirection 301 Moved Permanently
4xx : Erreur client 404 Not Found, 401 Unauthorized
5xx : Erreur serveur 500 Internal Server Error
22

En-têtes de requête§

Note

HTTP spécifie un très grand nombre d'en-têtes ; nous décrirons au fur et à mesure du cours ceux dont nous avons besoin.

Ces en-têtes servent à la négociation de contenu (conneg). Le serveur peut utiliser ces informations pour adapter le contenu de la réponse, mais il peut aussi les ignorer (lorsque la ressources est un fichier statique).

23

En-têtes de réponse§

Note

les en-têtes content-type et content-length sont en fait utilisés pour tout message ayant un contenu, y compris certaines requêtes (e.g. POST).

24

WSGI§

25

Serveur et application§

digraph {
  rankdir=LR;
  edge [arrowTail=normal; dir=both];
  client -> serveur
  serveur -> fichier
  serveur -> PHP
  serveur -> "programme CGI"
  serveur -> "python (WSGI)"
  serveur -> "..."
}

Les ressources du serveur peuvent être gérées de différentes manières

Note

  • Certaines ressources sont stockées directement dans des fichiers statiques (dont le nom est en général corellé avec le chemin de l'URL).
  • Certaines ressources sont gérées par un script PHP.
  • Certaines ressources sont gérées par un programme, répondant à certains standards, comme
    • CGI,
    • WSGI, que nous allons décrire dans ce cours,
    • ...
26

WSGI§

WSGI (Web Server Gateway Interface) est un standard spécifiant comment un serveur Web peut interagir avec une application Python.

27

Hello world WSGI§

def application(environ, start_response):
    message = b"Hello world\n"
    status = "200 Ok"
    headers = [
        ("content-type", "text/html"),
        ("content-length", str(len(message))),
    ]
    start_response(status, headers)
    return [message]
28

Explications§

Note

Plus précisément, la fonction doit retourner un itérable de chaînes d'octets. Cela permet dans certains cas au serveur d'envoyer les premiers octers avant que la fonction n'ait terminé son exécution.

29

Chargement du module§

n = 0

def application(environ, start_response):
    global n
    n = n+1
    message = ("Compteur: %s\n" % n).encode("utf-8")
    status = "200 Ok"
    headers = [ ("content-type", "text/html"),
                ("content-length", str(len(message))), ]
    start_response(status, headers)
    return [message]

Note

Dans l'exemple ci-dessus, plusieurs requêtes successives vont faire augmenter le compteur. Cependant, à tout moment, le module peut être déchargé par le serveur, et rechargé lors d'une nouvelle requête, ce qui remettra le compteur à zéro. Si on voulait persister la valeur du compteur, il faudrait la sauvegarder dans un fichier ou une base de données.

30

Le dictionnaire environ§

Il contient, entre autre, les clé suivantes :

Pour en savoir plus, consultez la spécification WSGI.

31

Serveur de développement§

from mon_projet import application
from wsgiref.simple_server import make_server
srv = make_server("localhost", 12345, application)
srv.serve_forever()
32