Par matériau textuel nous entendons les données textuelles qui sont à interpréter. Le matériau textuel est donc le support textuel de l'interprétation. Nous pouvons le considérer dans deux états bien distincts. Sur un plan physique, le matériau textuel peut être vu en tant que << données >> d'un signal transmis sous forme de caractères (puisqu'il s'agit de données textuelles). À ce niveau les mots et expressions linguistiques ne sont pas encore distingués, les entités textuelles ne sont pas délimitées.
Sur un plan linguistique, le matériau textuel peut être vu en tant que structure de signes linguistiques : dans un texte on distingue tout ce qui constitue une entité interprétable. Cette décomposition n'est pas donnée, elle demande un effort interprétatif. << Seuls des signifiants, sons ou caractères, sont transmis : tout le reste est à reconstruire (...) L'identification des signes comme tels résulte donc de parcours interprétatifs. >> [60, p.12].
Bien avant le traitement des signes (informatique ou non, automatique ou assisté) il faut bien les (re)construire. Et la reconstruction d'un signe linguistique demande l'identification de son signifiant (e.g. une chaîne de caractères dans un support électronique) que l'on doit associer à un signifié. L'interprétation (et donc l'intervention humaine) commence déjà là.
Le matériau textuel d'un support informatique ne peut contenir qu'une information purement symbolique. Avec une certaine complaisance entre l'homme et la machine, il constitue l'univers des signifiants. Mais nous y ajoutons de plus une organisation. Un tel matériau textuel contient un ensemble d'entités textuelles (des signifiants) qui ont déjà fait l'objet d'une interprétation. Par exemple, une quelconque chaîne de caractères au sein d'un texte fait bien sûr partie du matériau textuel brut. Mais dès que l'utilisateur la choisit au sein d'une interprétation, elle devient lexie, une entité textuelle interprétable.
Détaillons un peu une telle organisation du matériau textuel, dans l'objectif d'éclairer nos intentions.
Nous avons déjà mentionné la vision plate de ce matériau selon laquelle les lexies, les phrases, les textes sont exprimables de façon semblable, c'est-à-dire symbolique, que ce soit par écrit ou par oral. La forme élémentaire du matériau textuel est un ensemble de signaux continus, visuels (traits écrits) ou acoustiques (des sons).
En effet, dans cet espace textuel, tôt ou tard, sont délimités différents << niveaux de textualité >> avec des << entités textuelles >> qui en englobent d'autres, d'un niveau inférieur. Les niveaux de textualité (rangs selon [48]) généralement acceptés sont le morphème, le lexème, le syntagme et la phrase, auxquels une linguistique textuelle ajoute par excellence le texte. Nous remarquons tout de suite que les limites entre ces niveaux ne sont pas claires. Et, par exemple, dans [56] trois zones de localité contextuelle sont citées : << le syntagme minimal (ou mot), l'énoncé, et son au-delà textuel >> (p.73). Dans [60] il y a << quatre paliers de contextualité : le syntagme, la période, la section (chapitre, chant, etc.), enfin le texte. >>, (p.64).
Derrière la formation de différents niveaux de textualité, nous pouvons certes trouver divers avantages3.2. Entre autres, le fait que la décomposition en niveaux facilite l'examen scientifique et relativement autonome des entités de chaque niveau. Les entités de chaque niveau peuvent être répertoriées, analysées séparément et obtenir une description synthétique, de manière à pouvoir utiliser une entité textuelle d'un certain niveau pour faire appel à la description sémantique issue des entités englobées des niveaux inférieurs. Cette description peut provenir par exemple d'un dictionnaire, pour les entités textuelles du niveau du << mot >> ; ou d'un dépositaire de phrases figées3.3 (pouvant contenir aussi de proverbes et plus généralement de topoï [57]), pour le niveau phrastique ; ou bien, d'un répertoire de commentaires, pour le niveau du texte.
Malheureusement, la décomposition d'une entité textuelle en utilisant les entités des niveaux inférieurs et la synthèse de leurs descriptions pour en faire la description de l'entité en question, ne suffit pas. Sans doute, s'il en était le cas, on pourrait avec assurance partir à la quête du sens avec seulement un grand dictionnaire concernant les mots en étant sûr de posséder les éléments nécessaires à la description sémantique de toute combinaison de ces entités dans les niveaux supérieurs. Ce dernier -- hélas -- qui est le cas seulement dans les langages formels/informatiques dont la syntaxe et la sémantique sont précises et limitées, précisément, par le mode compositionnel. Autrement dit, la combinaison des symboles lors d'une production (et donc pratique de production) obtient, en général, un sens différent de la combinaison des sens de ses parties. Le global détermine toujours le local3.4.
Donc le passage d'un sens d'un niveau k à un sens de niveau k'>kn'est pas forcément prévisible. En matière de sémantique, la non compositionnalité constitue la règle. Les exemples font légion. Celui, issu du niveau lexical, est en plus amusant : le sens de 'pommade' est déterminé plutôt par sa présence dans des entités de niveau supérieur (phrases, textes) que par ses constituants (qui donneraient une signification équivalente à celle de 'citronnade' par rapport à 'citron', 'orangeade' par rapport à 'orange', ou 'rognonnade' par rapport à 'rognon', c.-à-d. préparation à base du jus de pommes, cf. [60, p.66]).
Cette vision nivelée de la matière textuelle lors de la production est directement liée à des localités textuelles lors de l'interprétation. Des parties de chaque niveau peuvent être interprétées de manière autonome au sein d'une entité de niveau supérieur et souvent même être incompatibles avec une interprétation au sein d'une autre entité de niveau supérieur. Cette divergence de sens ne peut pas être expliquée en prenant seulement en compte les niveaux inférieurs.
Par exemple, le mot 'dialectique' sera interprété différemment selon qu'on l'analyse dans un texte de Platon [80], [79] ou dans un texte de F. Rastier. Les mêmes phénomènes sont rencontrés aux niveaux supérieurs, notamment aux niveaux phrastique et textuel. Le sens d'une combinaison de phrases dépend bien sûr de l'intraphrase mais aussi du texte dans lequel ces phrases sont situées. Et donc le sens d'une seule phrase dépend aussi des autres phrases du texte.
Par exemple, la phrase simple << Elle s'est fait arraché le sac par un voyou >> :
Encore plus frappants sont les exemples impliquant l'aspectualité. Ainsi, la phrase (de simplicité syntaxique équivalente) << 2 min. plus tard le train déraillait >> peut avoir deux significations contradictoires :
Pour résumer, nous constatons à chaque niveau une triple détermination du sens :
Pour une théorie sémantique textuelle, le niveau du texte est fondamental. Il est aussi fondamentalement distinct des niveaux inférieurs. Tenant compte de cette primauté, nous préférons résumer les niveaux de textualité présentés plus haut en deux grandes catégories : le niveau intratextuel, comprenant les morphèmes, les mots, les expressions figées etc. (pour simplifier, nous dirons que le niveau intratextuel est descriptible principalement à l'aide de lexies [56] sans que cela empêche l'utilisation d'autres entités textuelles contenues dans le texte3.6) ; et le niveau textuel, le texte dans son unité et ses rapports avec les autres textes.
Seule reste à définir une entité englobant le texte et ses rapports
avec les autres textes, une sorte de localité << inter-textuelle >>,
qui sera à l'origine de la détermination << global
local
>> pour le niveau textuel. Il s'agit de l'entité nommée temporairement
intertexte et plus tard formellement définie sous le nom
d'anagnose, qui en retient les aspects opératoires.