La façon la plus évidente de définir l'égalité de deux entités types
de même niveau (e.g.
)
est à travers la comparaison
de leur nom (e.g. même liste caractères). Il faut donc supposer
que deux entités différentes de même niveau ne peuvent pas avoir le
même nom. D'autre part, si nous permettons à une entité (par exemple à
un texte) d'avoir plusieurs noms, la comparaison doit s'effectuer à
des niveaux différents. Soit pour chaque texte nous gardons l'ensemble
des noms utilisés, et donc la comparaison de deux noms devient un test
d'appartenance au même ensemble. Soit, au lieu de comparer les noms
des textes, nous comparons directement les contenus textuels. Cette
deuxième façon de définir l'égalité entre textes a quelques avantages
et quelques inconvénients. Notamment, elle permet d'attribuer
n'importe quel nom à un texte, sans contrainte : deux textes distincts
peuvent avoir le même nom, puisque la comparaison ne se base plus sur
le nom mais sur le contenu textuel. D'autre part, cette approche
oblige à garder toujours la connexion entre le nom et le texte tcauquel il se réfère.
Cette discussion permet d'estimer les complexités d'une fonction
d'égalité (véhicule de l'assimilation) définie sur les entités de
base. Puisque les éléments de base ne sont pas définis dans le
formalisme nous supposons que la fonction l'égalité entre eux est
définie à l'extérieur du formalisme :
,
,
.
Pour le cas des lexies, nous pourrions, de plus, disposer d'une proximité
morphologique au sein du même lexème
avec
des valeurs entre 0 et 1.