Les filtres et les expressions régulières

Les expressions régulières permettent d’exprimer des règles de recherche de chaînes de caractères dans des lignes de fichiers. On les utilise abondamment pour parser des fichiers.

Les expressions régulières ne sont pas seulement utiles dans le terminal... on peut les utiliser partout (en Python, en PHP, etc.).

Voici quelques règles pour exprimer des expressions régulières :

  • . un caractère quelconque
  • [abc] ou [a-c] une lettre parmi a, b ou c (la première est par extension, la seconde par intervalle)
  • [A-Ga-g] une lettre entre a et g, en majuscules ou en minuscules
  • [^abc] ou [^a-c] un caractère qui ne soit ni a, ni b, ni c
  • ^ indique le début de la chaîne
  • $ (se met à la fin) et indique la fin de la ligne
  • \ échappe un caractère spécial
  • a? a, zero ou une fois
  • a* a, zero ou n fois
  • a+ a, une ou n fois
  • a{2,4} a, répété deux à quatre fois
  • \w les lettres, les chiffres et le underscore
  • \W les autres caractères
  • \d les chiffres
  • \D le reste des caractères
  • | le OU logique

Combinées avec des commandes telles que cut ou grep, les expressions régulières sont particulièrement efficaces pour traiter des fichiers.