8 Analyser un corpus
8.4 Concordances
Cette commande construit une concordance kwic à partir des résultats de recherche correspondant à une requête CQL sur un corpus ou un sous-corpus sélectionné.
La boîte de dialogue de recherche est organisée de la façon suivante :
-
un champ pour saisir la requête CQL ;
-
un bouton pour accéder à l'historique des requêtes ;
-
un bouton pour accéder à l'éditeur des propriétés affichées des unités lexicales afin de sélectionner quelles propriétés seront affichées dans la colonne des pivots ;
-
le bouton « chercher » pour lancer le calcul.
-
le bouton « Cacher paramètres »: cache les paramètres de la concordance pour améliorer le confort de lecture.
Illustration 8.9 : La fenêtre de concordance
8.4.1 Requêtes
Le moteur de recherche vous permet d'exprimer dans le langage formel CQL (voir ci-dessous la section 5 « la syntaxe du moteur de recherche »).
TXM utilise une syntaxe simplifiée basée sur le langage CQL, afin d'écrire facilement des requêtes. Par exemple, pour rechercher « je », vous n'avez qu'à écrire « je » dans le champ « Requête ».
Pour des recherches plus complexes, vous pouvez utiliser toute la variété du langage CQL. Par exemple, pour chercher :
le mot « je » suivi d'un verbe
dans le corpus DISCOURS, vous pouvez saisir la requête suivante :
"je" [pos="V.*"]
Cette requête peut être décomposée ainsi :
-
"je" désigne le mot « je » ;
[pos="V.*"] indique que le verbe sera sur la droite du mot « je » :
les crochets [...] indiquent qu'il ne doit y avoir qu'une seule unité lexicale à la droite du mot « je » ;
pos="V.*" indique que l'occurrence doit porter l'étiquette morphosyntaxique « V.* ». Dans le corpus DISCOURS, étiqueté par Cordial et le jeu d'étiquettes Multext, cette requête sélectionne tous les verbes (dans ce corpus, tous les verbes ont une étiquette qui commence par « V »).
Il est également possible de lancer une requête assistée. En cliquant sur l'icone « Assistant de Requête » une fenêtre permet de construire plus facilement des requêtes CQL :
Illustration 8.10 : Construction d'une requête sur le mot "je" suivi d'un verbe.
-
Le bouton « mot supplémentaire » permet d'ajouter un mot à la requête.
-
Le premier menu déroulant permet de sélectionner une propriété de mot
-
Le second menu déroulant permet de sélectionner un champ de recherche plus ou moins restreint
-
Le dernier champ permet de saisir un mot ou quelques lettres.
-
Le menu déroulant situé entre les expressions de mots permet de préciser si les mots sont consécutifs ou non.
Si vous validez votre requête avec « OK », elle apparaîtra sous sa forme CQL dans le champ « requête ».
Pour lancer la recherche, cliquer sur le bouton « chercher ».
Avant d'afficher les résultats de la concordance, la zone de commentaire ainsi que la ligne de statut vous donneront le nombre total de résultats.
L'illustration 8.11 montre les résultats :
-
les résultats affichés vont de 22 à 41 (il s'agit de la deuxième page) ;
-
la colonne « pivot » recense les deux mots ciblés par la requête « je » suivi d'un verbe ;
-
les concordances sont triées par défaut alphabétiquement dans la colonne « pivot » ;
-
la référence prend la forme ici du nom du locuteur ;
on peut ouvrir le menu contextuel en cliquant à droite sur une concordance :
Définir le patron des références : régler les informations de la colonne référence ;
Définir la propriété de tri : définir la propriété de mot qui déterminera l'ordre de tri initial ;
Tri multiple : définir plusieurs clés de tri ;
Définir la taille des contextes : choisir le nombre maximum de mots dans les contextes de gauche et de droite ;
Lignes par page : définir le nombre de résultats dans la page
Sélectionner les propriétés : choisir les propriétés de mots qui seront affichées dans chaque colonne.
Illustration 8.11 : Concordance du mot « je » suivi d'un verbe dans le corpus DISCOURS.
8.4.2 Navigation
Une concordance commence par afficher la première page des résultats.
Les boutons de navigation permettent de visionner tous les résultats :
-
« [|<] » : retour à la première page ;
-
« [<] » : retour à la page précédente ;
-
« [>] » : aller à la page suivante ;
-
« [>|] » : aller à la dernière page.
-
« [Cacher/Montrer les paramètres] » : cache ou affiche les paramètres de la concordance pour plus de confort de lecture.
Le nombre de lignes par page par défaut peut être réglé via le menu « Fichier / Préférences », puis la fenêtre « TXM>Utilisateur>concordances ». Pour un réglage uniquement dans la fenêtre courante de la concordance, il faut passer par le menu contextuel du tableau de la concordance.
8.4.3 Retour au texte
En double-cliquant sur une ligne de la concordance, on retourne à la page de l'édition qui contient le pivot. L'édition est ouverte dans un nouvel éditeur.
Au sein de la page, le pivot est surligné en rouge, tandis que les autres pivots de la concordance se trouvant dans la même page sont surlignés en rouge clair.
Si on re-double-clique sur une ligne de la concordance, le même éditeur est utilisée. Pour une navigation dans l'édition, vous pouvez placer l'éditeur de l'édition à côté de l'éditeur de la concordance.
8.4.4 Tri
Vous pouvez trier les concordances selon chaque colonne : « Références », « Contexte gauche », « Pivot » et « Contexte droit » en cliquant sur leurs entêtes. Vous pouvez changer l'ordre de classement en cliquant une nouvelle fois sur l'entête. Vous remarquerez qu'alors les clés de tri changent en fonction de l'entête sélectionnée. Le tri par défaut se fait selon le pivot. Toutefois vous avez la possibilité de changer les propriétés de tri en cliquant sur « Définir la propriété de tri » dans le menu contextuel. Enfin vous pouvez effectuer un tri multiple en changeant chaque clé de tri.
8.4.5 Propriétés de mot
Chaque colonne contenant une propriété de mot peut être personnalisée de deux façons différentes :
-
les propriétés affichées pour le pivot peuvent être réglées en appuyant sur le bouton « éditer », situé à côté du champ requête ;
-
sur une concordance, sélectionner dans le menu contextuel « Définir les propriétés ».
8.4.6 Références
Vous pouvez choisir quelles informations seront affichées dans la colonne « référence » (sur la gauche dans chaque ligne de concordance).
Dans le menu contextuel, sélectionner « Définir le patron des références ». Une fenêtre s'ouvre, comme vous pouvez le constater dans l'illustration 8.12 :
Illustration 8.12 : Boîte de dialogue « patron des références »
Toutes les propriétés d'unités de structure et d'unités lexicales se trouvent dans la liste de gauche.
Par exemple, text:loc représente la propriété « loc » de la structure « text ».
Pour choisir une propriété, sélectionnez-là puis cliquez sur le bouton « > » pour la faire glisser dans le champ de droite. La liste qui se formera sur la droite correspondra à l'affichage dans la colonne référence.
Afin de retirer une propriété, sélectionnez-là dans la liste de droite et appuyez sur le bouton « < » afin de la faire basculer dans la liste de gauche.
Afin de changer l'ordre des propriétés dans la liste de droite, utiliser les boutons monter « ^ » et descendre « v ».
8.4.7 Export
Les concordances peuvent être exportées au format CSV : sélectionnez l'icone de la concordance dans la vue « corpus » et cliquez sur l'icone dans la barre d'outils ou sur la commande Export dans le menu contextuel.