9 Annoter un corpus
9.2 Annotation avancée par concordances
Illustration 9.3: Réglage annotation simple / annotation avancée
Le système d’annotation simple avec une chaîne d'annotation unique décrit dans la section précédente est le comportement par défaut de TXM. Si on positionne la préférence « TXM > Utilisateur > Annotation > Mode » à la valeur « avancé (avec types+valeurs) » :
On dispose alors d'un système d'annotation équivalent mais combinant deux informations (au lieu d’une seule) :
-
une catégorie (ou type) : de préférence un mot en minuscules simple ;
-
une valeur (quelconque).
Illustration 9.4: annotation d'occurrences du mot "Paris" avec la catégorie "lieu" et la valeur "Paris"
Par exemple, pour revenir au cas de la concordance de « Paris » on peut combiner la catégorie « lieu » et la valeur « Paris » :
Avec ce type d'annotation, l'exploitation (après sauvegarde des annotations) se fait à l’aide d’une expression de structure de la forme « <{catégorie}_ref="..."> ». C'est à dire que la catégorie crée une nouvelle structure ayant son nom dans le corpus (autour des pivots annotés), et la valeur devient la valeur de son attribut « @ref ».
Illustration 9.5: Recherche de la catégorie "lieu" à la valeur "Paris"
Par exemple pour le cas précédent :