9 Annoter un corpus
L’annotation d’un corpus consiste à associer à certains mots d’un texte des informations comme une catégorie, un mot clé, un type, une chaîne de caractères etc. puis à exploiter ces informations avec les outils de TXM.
Plusieurs outils d’annotation commencent à être développés au sein de TXM :
-
l’annotation simple ou avancée de séquences de mots par pivots de concordances ;
-
l’annotation de séquences de mots au sein d’éditions de texte avec un modèle d’annotation de type Unité-Relation-Schéma (URS).
Le premier outil est directement utilisable dans TXM, le second par le biais de l’installation de l’extension Analec.