En informatique on appelle expressions régulières une chaîne de caractère qui décrit, selon une syntaxe précise, un ensemble de chaînes de caractères possibles. Les expressions régulières sont également appelées regex.
Une séance a été consacré aux expressions régulières, ce fut l'occasion de voir et même revoir cela. La liste ci-dessous représente quelques regex.
Nous avons cité dans les anciens articles quelques expressions régulières comme egrep. Mais n'oublions pas que cette commande peut prendre différentes options. Par exemple "egrep" peut prendre les options suivantes ;
–color : elle permet de mettre en évidence certaines parties du texte souhaitées.
– o : (only matching), va donc prendre en compte les récurrences du motif mentionné. Nous obtiendrons la liste des mots recherchés.
– i : case insensitive
– v : qui ne prend en compte que les ligne ou le critère n’est pas présent.
Voici certaines expressions régulières et leurs significations:
[0-9] chaîne contenant un chiffre
-?[0-9] un chiffre éventuellement précédé du signe moins
[A-Z] chaîne contenant une lettre en majuscule (sans majuscule accentuée)
^[a-z]+$ chaîne restreinte à un seul mot non vide en minuscule (sans lettre accentuée)
[A-Z][^0-9] une chaine contenant une majuscule non suivie d'un chiffre
^[0-9]?[0-9]?[0-9]?[0-9][A-Z][A-Z]
$chaine composée uniquement de 1 à 4 chiffres suivi de deux lettres en majuscules
\w Caractères alphanumériques
+ au moins une fois
? au plus une fois
* Zéro ou plus
^ Début de la chaîne
$ Fin de la chaîne
. N’importe quel caractère
\ caractère d’échappement
A | B A ou B
^[A-Z][a-z]*$ chaîne qui contient un seul mot dont l'initiale est en majuscule et le reste en minuscules
[A-Z][A-Z]+ chaîne contenant au moins deux majuscules consécutives
\b Limite/Frontière de mot
On peut en ajouter d’autres comme par exemples les complémentaires des raccourcis :
\D Tout sauf un chiffre
\S Tout sauf un espace
\W Tout sauf un caractère
\B Tour sauf une limite de mot
Comentários