Les languages formels
La théorie des langages formels fut initialement initiée par les linguistes qui tentaient de représenter les langages naturels (exemple, français, anglais, etc). Mais elle s'est révélée être très utile pour l'informatique pour tout un cas d'applications. Notamment les RegEx, et les règles syntaxiques des langages de programmations (avec l'analyse syntaxique).
Un langage naturel va être défini par une orthographe, une grammaire, une conjugaison. Un langage dit formel (tel que les langages de programmations), vont être défini par des règles de constructions. Ainsi, les erreurs syntaxiques d'un code peuvent être détectées grâce à ces mêmes règles de constructions.
La théorie des langages a pour but de décrire les langages formels. Elle ne concerne que les aspects purement syntaxiques du langage. Un langage formel est généralement défini par une grammaire formelle (grammaires algébriques, par exemple) et analysé à l’aide d’automates.
Donc un langage formel va être généré à l'aide d'une grammaire formelle et analysé à l'aide d'un automate.
Alphabets, lettres et mots
L'alphabet est un ensemble fini et non-vide d'éléments appelé lettres ou symboles terminaux. Cet ensemble va être représenté par la lettre
correspond à l'ensemble de tous les mots sur correspond à l'ensemble de tous les mots non-vide sur
Un mot est une séquence finie de lettres. Ainsi dans l'alphabet précédent a
, ab
et else
sont des mots par exemples.
Le mot vide est noté
Opérations
La concaténation est une opération binaire effectuée sur l'ensemble
Une concaténation des mots
Un exposant
Ainsi ab
est présente une fois ou plus. Et vb
est présente 0 fois ou plus.
Une autre opération est qu'un mot peut être retourné en lui mettant un exposant de -1
. Donc
Et on peut aussi récupérer la longueur d'un mot (nombre de symboles terminaux/lettres) comme ceci
Langage
Un langage est un sous ensemble de
est le langage de tous les mots de longueur 1 sur est un langage ne contenant aucun mot- {
} est un langage ne contenant que le mot vide langage contenant tous les mots sur langage contenant tous les mots sur
Sur l'ensemble
Aisni si
On peut utiliser la notation
Pour décrire un langage avec une infinité de mots, on peut utiliser un système générateur (grammaire, RegEx ou diagramme syntaxique) pour générer des mots du langage et des automates finis pour les détecter.