Exposé de soutenance de la thèse : L’apport
de la modélisation des connaissances à la codification et à la
simplification des textes normatifs.
Christian Tremblay – 28 mai 2002
Télécharger
Introduction
S’il fallait définir exactement le contenu de ma thèse, je dirais
qu'il s'agit de l’analyse préalable au cahier des charges d'un
programme de développement relatif au traitement assisté par
ordinateur des textes normatifs dans un but de codification et plus
généralement d'accessibilité du public aux textes normatifs.
Cette analyse préalable tente de répondre à des questions
essentielles :
- peut-on modéliser sans appauvrir le sens ?
- peut-on modéliser directement à partir de l'analyse
textuelle ?
Nous répondons positivement à ces deux questions sous les deux
conditions :
- de l'application d'une approche systémique respectant la
complexité fondamentale
- du recours aux ressources de la linguistique
L'analyse textuelle apparaît comme le niveau incontournable ,
qu'elle soit manuelle ou assistée par ordinateur, qui mène du texte à
sa modélisation. Elle sera le fil directeur de toute la démarche.
L'exposé aura une orientation résolument opératoire plus que
théorique.
Il est censé être compréhensible sans qu'il soit nécessaire
d'avoir lu la thèse.
Cette orientation a comme contrepartie de devoir commencer par
rappeler quelques notions de base, outils fondamentaux sur lesquels
s'appuie la démonstration.
Nous traiterons ensuite de cas pratiques d'interprétation, de cas
pratiques de compréhension et d'interaction, et de cas pratiques
d'opérations normatives.
Enfin nous conclurons par quelques conséquences au plan des
développements informatiques.
·
Notions de base
·
Trois cas pratiques d’interprétation
·
Un cas pratique de compréhension et d’interaction en
langage naturel
·
Cas pratiques d’opérations normatives
·
Quelques implications au plan informatique
Toutes les notions de base énoncées ci-après sont issues de l’œuvre
de Bernard Pottier, complétés, s'agissant en particulier de la
micro-sémantique, par les travaux de François Rastier.
·
Notion de schème
·
Théorie des voix
·
Micro-sémantique
·
Sémiogramme
·
Toute phrase, tout énoncé comporte un support
conceptuel. Toute phrase, tout énoncé est la manifestation formelle
d’une ou plusieurs relations sous-jacentes, se situant à un niveau
appelé conceptuel.
·
Niveau conceptuel
Le niveau conceptuel se définit comme indépendant des langues : c’est
le niveau où s’opèrent tous les phénomènes de compréhension
profonde, tous les phénomènes de mémorisation, et tous les transferts
de langue à langue.*
·
Le propos, la base et le prédicat
Chacune des relations fondamentales qui est sous-jacente à un
énoncé ou un texte est appelée un propos (ce que l’on se
propose de communiquer).
Le propos comprend deux éléments : la base (ce sur quoi l’on
se propose de communiquer) et le prédicat (ce que l’on
communique à propos de la base)
Partant du niveau conceptuel, l’énonciateur procède à un certain
nombre de choix qui vont modeler l’énoncé.
Opérations obligatoires
·
Schème d’entendement (SE)
choix des lexèmes modules actantiels
·
Schème prédiqué (SP)
choix prédicatif = détermination de la base de
vision
Opérations facultatives
Nous n’en donnons ici qu’une énumération
·
Topicalisation
·
Focalisation
·
Impersonnalisation
·
Hiérarchisation phrastique (juxtaposition,
coordination, subordination)
·
Réduction d’actance
·
Détermination
·
–Modalisation
·
Aspectualisation
Le résultat de ces transformations successives mais instantanées
dans l’acte d’énonciation est le Schème résultatif (SR).
Ces opérations existent dans toutes les langues, et relèvent de la
linguistique générale. Elles sont codifiables.
Dès que l’on quitte le domaine conceptuel, c’est-à-dire dès le
choix des lexèmes, on entre dans des contraintes sémantico-syntaxiques
propres à chaque langue, car chaque lexème entraîne un certain type
de module actanciel.
La théorie des voix donne une classification sémantique des modules
actanciels.
La théorie des voix permet de distinguer entre :
– Pierre traverse la rue ou Pierre arrive de Paris
et et
– La chat regarde la souris Pierre est âgé de 30 ans
La théorie des voix comporte une nomenclature de base de cinq voix :
existentiel, équatif, situatif, descriptif, subjectif, lesquelles
possèdent trois statuts: statif, évolutif, causatif, lesquels statuts
sont eux-mêmes décomposables et traversent des champs sémantiques
variés.
Il est impossible d’en dire plus à ce niveau.
•Sémème
Contenu d’un morphème (signe minimal ou signifiant). Le sémème
se compose de sèmes ou traits sémantiques.
•Taxème
Classe sémantique au sein de laquelle les sémèmes sont
inter-définis.
•Domaine
Classe sémantique composée de taxèmes, tel que dans un domaine
donné il n’existe pas de polysémie. Le domaine est lié à des
normes sociales et à l’expérience du groupe (ex.: alimentation,
musique, politique, droit, etc.)
•Dimension
Classe sémantique de généralité supérieure, indépendante des
domaines. Ex.: matériel/immatériel, animé/inanimé
•Dans une représentation objet un sémème appartient à un
taxème, lequel appartient à un domaine et à une dimension. Dans un
même domaine, on rencontrera des taxèmes de dimensions différentes.
•Générique
·
Le sème générique marque l’appartenance du sémème à
une classe sémantique (taxème, domaine, dimension)
·
L’ensemble des sèmes génériques constituent le
classème
·
Un même sème générique rapproche deux sémèmes par une
relation d’équivalence
•Spécifique
–Sème permettant à l’intérieur d’un même taxème de
distinguer les sémèmes entre eux.
–L’ensemble des sèmes spécifiques constituent le sémantème
–Les sèmes spécifiques (différents par définition) permettent d’opposer
des sémèmes voisins par une relation d’incompatibilité.
•
Inhérent
–Un trait inhérent est un trait codifié en langue, c’est-à-dire
indépendant du contexte.
–Un trait inhérent peut être générique ou spécifique
•
Afférent
–Un trait afférent est déterminé par le contexte textuel (cotexte)
ou situationnel (pragmatique).
–Un trait afférent peut être générique ou spécifique
Schéma récapitulatif

·
Polysémie
Pour un même signifiant, on peut avoir plusieurs sémèmes. Ex.
bureau
·
Polysémie d’emploi
Il y a polysémie d’emploi lorsque deux sémèmes diffèrent par au
moins un sème localement afférent. Ex.: convoi militaire et convoi
funéraire
·
Polysémie d’acception
Il y a polysémie d’acception, lorsque deux sémèmes diffèrent
par au moins un sème afférent socialement normé. Ex. : minute et
minute
·
Polysémie de sens
Il y a polysémie de sens, lorsque deux sémèmes diffèrent par au
moins un sème inhérent.
·
Homonymie
Deux sémèmes diffèrent par au moins tous les sèmes spécifiques
·
Structure intermédiaire entre le sémème et la
connaissance encyclopédique.
·
Le sémème ne contient que les sèmes qui sont
strictement nécessaires à son identification.
·
Le sémiogramme comprend toutes les « relations
sémantiques essentielles gravitant autour d’un sémème :
association, inclusion, opposition, participation ».
·
Il constitue l’environnement sémantique du sémème ou
encore la « visualisation sémantique du sémème » dans
un domaine donné.
Nota : notion distincte de celle de domaine notionnel selon Culioli,
qui inclut tous les sens, acceptions et emplois (cf. p. 256 Thèse),
alors que le sémiogramme se situe dans un domaine sémantique défini
comme excluant la polysémie.
·
Sur la notion de « bureau »
·
« Il est interdit de marcher sur la pelouse »
·
Loi PML et conseils d’école
Parmi les nombreux sens du mot bureau (sans distinguer pour la
simplicité de l'exposé les différences de sens, d'acception ou
d'emploi), nous en retenons trois : le bureau, synonyme de table de
travail, le bureau, pièce où l'on travaille, le bureau désignant le
lieu de travail, travail tertiaire par opposition à l'usine ou à
l'atelier.
Nous sommes dans un cas de polysémie de sens caractérisée dans la
mesure si le mot travail est un sème inhérent commun, donc
générique, aux trois taxèmes "meuble",
"pièce-local", "lieu de travail", les sèmes
"meubles", "pièce-local", "lieu de travail
tertiaire", sont bien des sèmes distinctifs, donc spécifiques. Il
est intéressant d'observer qu'en espagnol, à ces trois sens du mot
bureau correspondent des mots différents : escritorio, despacho,
oficina. Il en est de même en anglais : desk, study, office.
D'autres correspondances pourraient être identifiées au niveau des
polysémies d'acception ou d'emploi (ex. : bureau de poste : post
office, bureau de vote : poll station).
Il est donc essentiel qu'au niveau du texte source on puisse par
l'analyse textuelle identifier le sème jouant le rôle de sélecteur de
sens permettant de déterminer la bonne interprétation dans la langue
source et le mot correspondant dans une langue cible.
Un nombre plus ou moins grand de sèmes peut, selon le contexte,
jouer ce rôle. Les exemples qui suivent s'en tiennent au cotexte le
plus immédiat. Ainsi :
Recherche d’un sélecteur :
1.Il travaille à son bureau (sème spécifique : extériorité)
il est assis à son bureau (mais » il est assis dans son
fauteuil »)
il est à son bureau
le dossier est posé sur son bureau
il est endormi sur son bureau
il lit à son bureau
il écrit à son bureau
2.Il travaille dans son bureau (sème : intériorité)
il est assis dans son bureau
il est dans son bureau
le dossier est dans son bureau
il est endormi dans son bureau
il reçoit dans son bureau
il lit dans son bureau
il écrit dans son bureau
3.Il travaille au bureau (sème : lieu)
il est parti au bureau
il reçoit au bureau
il est en réunion au bureau
sa vie se passe au bureau
Choix du sélecteur
- « extériorité » pour bureau(1)
- « intériorité » pour bureau(2)
- « lieu (flou) » pour bureau(3)
On peut discuter du choix du sème faisant office de sélecteur. Il
est évident que si le sème inhérent spécifique est déjà présent,
la sélection est immédiate. Le cas traité ici est un peu plus
subtile.
En tout état de cause, nous dégageons de cette rapide analyse la
conclusion que la problème de la polysémie n'est pas soluble, aussi
bien au niveau de l'interprétation dans une seule langue, qu'à celui
de la traduction automatisée par ordinateur, sans recours à l'analyse
sémique, et notamment à la mise en évidence des isosémies ou des
isotopies, faits scientifiques aussi certains et opératoires que le
sont les courbes de niveau en géographie physique.
L’exemple suivant, emprunté à Paul Amselek, vise à illustrer la
difficulté d’une interprétation logiciste de la norme telle qu’on
pourrait la tenir à partir de l’article 5 de la DDHC selon laquelle
tout ce qui n’est pas défendu par la loi ne peut être empêché, et
selon les préceptes du maître de Vienne, Hans Kelsen.
L’énoncé « Il est interdit de marcher sur la
pelouse » peut être interprété au moyen du carré déontique,
selon le schéma ci-après.

Nous laissons de côté l’obligation et le facultatif qui donnent
des énoncés logiquement valides, mais linguistique non valides.
Limitons-nous à la permission.
En fait nous avons deux éléments combinés dans la proposition : « marcher » et « pelouse ».
Donc, l’interdiction de marcher sur la pelouse peut avoir trois
conséquences au regard de la permission :
Pour « pelouse » :
·
marcher en dehors de la pelouse : OK
Pour « marcher » :
Il est permis de :
·
ne pas marcher sur le pelouse : OK (il suffit de
s’abstenir de marcher)
·
faire autre chose que marcher sur la pelouse: NON OK.
En effet, il est clair que s’il est interdit de marcher sur la
pelouse, il est également interdit d’y faire du vélo ou du
roller, c’est-à-dire toute activité susceptible de détériorer
la pelouse, et à laquelle celle-ci, naturellement fragile, ne
pourrait résister longtemps.
Autrement dit, la glose sur les termes « interdiction,
obligation, permission, facultatif », à laquelle conduit l’application
du carré déontique est d’un intérêt médiocre, car le problème d’interprétation
ne concerne pas ces termes, mais le sens qu’il faut donner à
« marcher sur la pelouse ».
Si « pelouse » est physiquement parfaitement circonscrit,
il n’en va pas de même de « marcher ».
Ici, « marcher » ne désigne par seulement l’activité
de « marcher », mais toute activité à laquelle se livreraient
les utilisateurs du jardin public et qui aurait le même effet
destructeur.
Nous conclurons donc qu’il est nécessaire de se livrer à un
processus interprétatif pour déterminer la portée de l’interdiction
de « marcher sur la pelouse » = « …et tout activité
similaire » et que pour ce faire, il y a lieu de faire appel à la
notion de prototype bien connue en sémantique.
Accessoirement, nous soulignerons que si le « principe de
complétude » de Kelsen dont l’application la plus typique est
le principe selon lequel « tout ce qui n’est pas
interdit » est permis » n’est pas contestable, il n’est
néanmoins opératoire qu’au prix d’un détour interprétatif
complexe.
3e cas pratique : Loi
PML et conseil d’école
Le problème posé vient de la récente loi du 27 février 2002 sur
la démocratie de proximité qui a soulevé une question de
compatibilité avec le décret du 6 décembre 1990, pris pour l’application
de la loi du 10 juillet 1989 sur l’éducation, et qui réglemente en
son article 17 les conseils d’école.
Ainsi le décret dispose que le conseil d’école comprend le Maire
ou son représentant et un membre du conseil municipal.
La loi modifiant la loi PML (art. L.2511-19 du CGCT) introduit la
disposition que le conseil d’arrondissement procède, en son sein, à
la désignation des représentants de la commune dans les organismes
dont le champ d’action est limité à l’arrondissement, et précise
que cette disposition est applicable aux conseils d’école.
Se pose en premier lieu un
•Problème de hiérarchie des normes juridiques
Une loi d’application territorialement limitée l’emporte a
priori sur un décret même de portée nationale. Il faut néanmoins
pour cela qu’il y ait une contradiction non susceptible d’être
levée.
La question porte alors sur l’interprétation de la notion de
« représentant de la commune ».
Le représentant de la commune est-il :
·
L’élu du conseil municipal
ou
·
L’élu du Conseil municipal et le Maire ou son
représentant
Il n’y a en fait qu’une seule réponse : l’élu du conseil
municipal. Le Maire qui est légalement à la fois chef de l’exécutif
municipal et représentant de l’Etat ne peut être remplacée par un
représentant de la commune désigné en son sein par le conseil d’arrondissement.
La loi n’a pas pu davantage vouloir substituer par la disposition en
question le maire d’arrondissement au Maire de la commune.
Solution : un problème de hiérarchie des normes; un processus
interprétatif complexe concernant la notion de représentant du maire.
Tout système permettant de traiter ce genre de problème devrait être
doté d’une capacité de raisonnement sur la hiérarchie des normes
relativement puissant.
Le nombre de paraphrases pour un énoncé varie de zéro à l’infini,
l’élément incontrôlable étant le niveau de mobilisation des
connaissances encyclopédiques qui dépend de l’énonciateur.
Toutefois, pour un niveau déterminé de mobilisation de ces
connaissances, on peut contrôler la création paraphrastique.
Prenons l’exemple du premier alinéa de l’article 6 de la
Constitution française pour lequel nous proposons 4 formulations s’écartant
très peu du texte original :
•Art. 6C – Le Président de la République est élu pour cinq ans
au suffrage universel direct.
Un système de compréhension doit être capable de calculer l’équivalence
de ces différentes formulation. On observera que les deux termes
nouveaux, mais dont la présence s’impose dans le sémiogramme, sont
« mandat », attaché à élection, et « Chef de l’Etat »,
indissociable de « Président de la République ».
Le schème correspondant à ces 5 formulations est le suivant.
Pour répondre donc aux questions 1, 3 et 4, il convient que le
système détermine si la réponse se trouve localement dans le schème
ou s’il doit la chercher ailleurs dans la base de connaissances.
Il s’agit de ce que je considère comme étant l’apport principal
de mon travail. L’opération normative est une structure sémantique
typique des textes normatifs. J’ai isolé une vingtaine de ces
structures depuis le principe général (PG), jusqu’à la norme
prescriptive de la norme applicable (NPNA), en passant par la norme
prescriptive d’une interdiction (NPI). Nous en traiterons ci-après à
partir d’exemples.
Art. 6C – Le Président de la République est élu pour cinq ans au
suffrage universel direct.
Art. 7C – Le PdR est élu à la majorité absolue des suffrages
exprimés. Si celle-ci n’est pas obtenue au premier
tour de scrutin, il est procédé, le deuxième dimanche suivant, à un
second tour.
Art. 8C – Le PdR nomme le PM. Il met fin à ses fonctions sur
présentation par celui-ci de la démission du gouvernement.
Intuitivement seuls P1 et P2 correspondent à des opérations
normatives. Nous voudrions isoler les éléments permettant des les
distinguer entre eux et d’établir que P3 et P4 ne peuvent relever du
domaine des textes normatifs.
–P1/P2 : P1 = NDS = équatif évolutif; P2 = NAC = équatif
causatif. ON peu déduire de P2 une NDS (« le Premier Ministre est
nommé par le Président de la République, qui met fin à ses fonctions
sur présentation par lui-même de la démission du gouvernement)
Nous devons tirer de ces quelques exemples une conclusion importante
: aucun trait inhérent n’est suffisant pour établir le caractère
normatif d’un texte. Aucun texte n’est par lui-même normatif. Il
faut qu’il le soit de surcroît formellement, directement ou
indirectement. Il faut un signe extérieur particulier : aujourd’hui,
la signature et la publication au journal officiel, l’affichage sur
les panneaux officiels, etc. Sous l’ancien régime, l’annonce par le
héraut du roi sur la place du village, etc. Mais la citation conserve
au texte cité sa valeur normative…