Par partie de texte nous entendons une partie, plus ou moins étendue -- une expression, une phrase, un ou plusieurs paragraphes -- d'un texte, au sens habituel du terme, e.g. un texte journalistique ou publicitaire, un roman, un article scientifique. Cependant, une partie de texte est dotée d'une autonomie sémantiquement limitée dans la mesure où elle est systématiquement dépendante d'une unité d'ordre supérieur, le texte.
Un texte peut être vu d'un point de vue purement symbolique, en tant que chaîne de caractères proprement formatée. Mais un texte ne se réduit pas à une chaîne de caractères : il n'y a en réalité qu'un très petit nombre de chaînes qui sont considérées comme textes.
Le texte est une unité sémantique considérée d'un point de vue plus global qui intègre :
Considérons pour le moment la notion de texte par rapport aux méthodes d'un traitement sémantique automatique2.2. La partie de texte, à l'entrée du système (cf. le tab. 2.1), e.g. une phrase, une partie plus ou moins étendue d'un texte, est considérée comme une composition d'unités textuelles plus petites. Ainsi, une phrase est décomposée en une organisation syntaxique de mots et un mot en un ensemble d'opérations grammaticales (morphosyntaxe) sur la racine.
![]() |
En parallèle (ou ultérieurement, selon le type de traitement, [82], [16], [24]) la représentation sémantique est construite. La méthode généralement acceptée commence par une base de << sens élémentaires >> que l'on peut faire correspondre aux constituants textuels élémentaires -- en principe les unités lexicales -- retrouvés dans un dictionnaire (voir aussi la fig. 2.1). Selon une méthode de composition (ou de synthèse), les << sens élémentaires >> sont combinés pour former le sens de l'unité textuelle globale (dans ce cas, de la phrase). Les méthodes de composition des sens partiels divergent largement2.3, mais la philosophie sous-jacente dépend toujours du principe de compositionnalité sémantique :
Le principe est très attractif d'un point de vue informatique : un petit ensemble d'informations (e.g. dictionnaire) pourrait être convenablement composé afin de construire le sens de n'importe quelle phrase, aussi complexe soit elle. Et, par extension, le sens d'un texte entier. Attractif aussi dans la mesure où il homologue la philosophie informatique formelle (d'ordre logico-calculatoire) et l'émergence du sens. Mais illusoire quand on s'intéresse au sens d'un texte, pour deux raisons principales.
Les sens des sous-expressions sont combinés à l'aide d'indices grammaticaux et syntaxiques, or le texte n'est pas régi par une syntaxe au même titre que la phrase. Malgré les études sur la structure d'un texte (théories de la narration [8], qui va de pair avec la critique qui lui est << réservée >> dans [69], [34], [81] et, bien entendu, [55] ; théories du récit et du dialogue [72], [35] ; etc.), on peut vérifier facilement que jusqu'alors les théories linguistiques adoptant le principe de compositionnalité admettent comme limite raisonnable de l'objet d'étude la phrase (cf. [60, p.37]).
Mais il y a aussi une raison plus fondamentale. Le sens << élémentaire >> des sous-expressions n'est pas << donné >>, il n'est peut-être même pas répertorié dans des dictionnaires. Il est construit au sein d'une situation, elle-même déterminée par une pratique de communication, où le texte entier, son genre aussi, participent, orientent et posent des contraintes.
Par exemple, considérons un objet d'étude limité à la phrase et essayons d'appliquer une méthode de compositionnalité sémantique à la << phrase >> suivante :
Dans les meilleurs des cas, nous pouvons arriver soit à un << archi-sens >> abstrait et prototypique (et donc très faiblement opératoire), soit à une multitude de sens plausibles en combinant les possibilités d'ambiguïté sémantique retrouvées dans les dictionnaires pour chacun des mots de la phrase.
Mais le sens -- mieux, les sens -- de la phrase peuvent être pleinement reconnus seulement après la lecture de l'intégrité du sonnet de Mallarmé, dont fait partie la << phrase >>. On pourrait ainsi reconnaître le jeu sémantique2.4 entre la thématique de navigation (e.g. 'tangage') et celle d'un banquet (e.g. 'ivresse', 'salut').
Pour aller encore plus loin dans l'analyse sémantique (et faire correspondre par exemple le mouvement de la plume d'un écrivain au substantif 'tangage') il faut connaître plus ou moins le type de la poésie de Mallarmé, la période où le sonnet est écrit, les conditions de sa parution, les autres textes de la publication, etc. Autant de facteurs qui ne sont pas constants entre différents lecteurs, ce qui multiplie mais aussi affine les possibilités interprétatives.
Pour revenir à l'essentiel de cet argument, est-ce que l'homme << atteint >> le sens en s'appuyant exclusivement sur le texte, autrement dit, est-ce que le sens qu'il trouve est immanent au texte ? Une réponse affirmative limiterait l'impact de la culture, ou de l'histoire sur la construction du sens du texte. Encore plus, les influences d'une culture personnelle (et plus généralement d'un milieu social) sur la constitution du sens d'un texte sont déterminantes et leur rôle ne peut pas être négligé dans un modèle de la compréhension de textes.
Si la compréhension humaine est l'idéal qu'une << compréhension >> informatique pose comme objectif, un système de compréhension de textes doit prendre en compte aussi la situation de l'interprétation et les normes imposées par le genre et par la pratique sociale dont fait partie le texte entier : le sens n'est pas attribué au texte seul mais à une situation d'interprétation, incorporant le lecteur qui la produit, ses objectifs et ses sources d'information (cf. 2.1.2). À supposer toujours que l'on admet l'idéal de la compréhension humaine, le sens d'une phrase ne peut pas être exclusivement le produit des mots et expressions qui la composent syntaxiquement. Il dépend du texte entier. Il dépend aussi d'une lecture2.5 particulière.
En d'autres termes le sens d'une partie de texte n'est pas immanent à cette partie. Cette affirmation est vraie pour un mot et pour une phrase et nous allons voir que nous avons intérêt à la considérer vraie pour un texte entier -- sauf si l'on se limite à une langue qui ressemble à un langage informatique et dont la stricte technicité permet de considérer une seule et unique signification par mot et un ensemble de règles de composition précises pour générer la représentation sémantique globale.
C'est la solution traditionnelle du traitement sémantique de textes fonctionnant selon le paradigme des grammaires informatiques2.6. En imposant des limites fortes à l'expression linguistique prise en compte (e.g. corpus de textes très restreint, contenu principalement technique, cf. [24], [71]), nous avons pu rendre le principe de compositionnalité utile et surtout opérationnel.
L'importun pour les traitements automatiques du sens des textes est qu'ils se posent des limites en ce qui concerne l'objet d'étude lorsque, précisément, cet objet commence à devenir sémantiquement intéressant, i.e. lorsqu'on s'approche des unités textuelles de taille réelle, produites dans des conditions réelles (e.g. un texte journalistique ou littéraire, un discours politique, un développement philosophique, etc.). Il n'existe pas de système de traitement automatique du sens des textes << sémantiquement riches >>.
Devant la difficulté évidente à laquelle se heurte le traitement de textes fondé sur le principe compositionnel, il convient de modifier la méthode plutôt que l'objet d'étude : au lieu de s'éloigner de l'objectif d'un objet d'étude sémantiquement riche, pour rester attaché à un traitement automatique, nous préférons adopter une nouvelle méthode qui puisse traiter aussi (et surtout) ce type de textes.
Les nouveaux besoins imposent que le sens ne dépende pas seulement de
l'objet texte. Il est oiseux de démontrer qu'un même texte, lu par un
autre lecteur, puisse avoir un sens différent. Ou que le même lecteur
dans un autre moment de lecture (e.g. situation politico-économique
différente) trouvera d'autres éléments sémantiques pertinents. De même,
s'il apprend qu'il s'agit d'une
uvre d'un autre auteur, écrite
peut-être dans des conditions ou un milieu différents, il
produira éventuellement un tout autre sens.
L'auteur, le lecteur, l'entour (de production et de réception) : voici les authentiques composantes qui, avec le texte-même, produisent le sens de ce dernier.
La modification d'une composante peut entraîner la modification
partielle ou totale (dans les cas par exemple de changement radical de
milieu culturel) du sens d'un texte et d'une
uvre en général.
La Sémantique Interprétative, précisément, rejette le
principe de compositionnalité (automatique ou non) et propose une
méthodologie centrée autour de l'interprétation mettant en
uvre plusieurs acteurs en vue de la construction du sens : le lecteur avec sa compétence interprétative, l'auteur
avec sa compétence générative, la pratique sociale lors de
la production et de la réception, et bien sûr le texte (et
son genre textuel), qui constitue l'indivisible objet d'étude.
Même s'il existe des cas où le sens est le résultat d'une composition des sens partiels, dans le cas général, le sens est le produit d'une double activité interprétative :
Examinons plus en détail les différentes composantes de la production du sens dans la Sémantique Interprétative.