11 Préférences
11.3 Section TXM / Utilisateur
Section de réglage des commandes de TXM.
Paramètres généraux du comportement de l'interface :
-
Pas de confirmation pour supprimer un objet : pour ne plus faire de demande de confirmation lors de la suppression d'un objet de la vue Corpus ;
-
Recalculer automatiquement : pour recalculer certains résultats directement après la modification de certains paramètres.
11.3.1 Analyse factorielle des correspondances
-
Fréquence minimale : filtrage des lignes par fréquence minimale lors de l’appel sur une partition ;
-
Nombre de lignes : nombre de lignes maximum lors de l’appel sur une partition ;
-
Format de la colonne Qualité : format d'affichage des valeurs de qualité de représentation dans le plan. Voir la section 11.3.16.1 ;
-
Format de la colonne Contribution : format d'affichage des valeurs de contribution aux axes ;
-
Format de la colonne Contribution : format d'affichage des valeurs de contribution aux axes ;
-
Format de la colonne Masse : format d'affichage des valeurs de masses ;
-
Format de la colonne Distance : format d'affichage des valeurs de distance ;
-
Format de la colonne Cos² : format d'affichage des valeurs de cos² ;
-
Format de la colonne Coord : format d'affichage des valeurs de coordonnées ;
-
Afficher les colonnes : afficher les points colonnes (ou variables) ;
-
Afficher les lignes : afficher les points lignes (ou individus).
11.3.2 Annotations
Mode :
simple (avec catégories) : on annote par mots-clés ou catégories ;
avancé (avec types+valeurs) : on annote avec des paires catégories (ou type)-valeur.
11.3.3 Classification
-
Nombre de clusters : nombre de classes à calculer ;
-
Méthode : algorithme de construction des classes ;
-
Métrique : distance utilisée par l'algorithme ;
-
Afficher les graphiques en 2D ou en 3D : affiche ou non les classes dans le même graphique que les plans factoriels de l'AFC.
11.3.4 Concordances
-
Lignes par page : nombre de lignes à afficher par page de concordances ;
-
Contexte Gauche (en mots) : nombre de mots du contexte gauche ;
-
Contexte Droit (en mots) : nombre de mots du contexte droit.
11.3.5 Cooccurrences
-
Format de l'indice : format d'affichage de l'indice de spécificités ;
-
Seuil minimum de fréquence du cooccurrent : fréquence minimale pour qu'un mot puisse participer au calcul des cooccurrents ;
-
Seuil minimum de fréquence de cooccurences : fréquence minimale des rencontres pour qu'un mot puisse participer au calcul des cooccurrents ;
-
Seuil minimum de l'indice de cooccurences : seuil en deçà duquel le cooccurrent ne fait pas partie de la liste des résultats ;
-
Minimum à gauche : distance la plus proche des cooccurrents de gauche ;
-
Maximum à gauche : distance la plus éloignée des cooccurrents de gauche ;
-
Minimum à droite : distance la plus proche des cooccurrents de droite ;
-
Maximum à droite : distance la plus éloignée des cooccurrents de droite ;
-
Utiliser le total des fréquences de cooccurrents plutôt que de celles de tous les mots du corpus : limite les fréquences marginales aux mots cooccurrents plutôt qu’à l’ensemble du vocabulaire du corpus dans le modèle des spécificités.
11.3.6 Description
-
Nombre de valeurs de propriétés affiché : nombre maximal de valeurs différentes à afficher par propriété ;
-
Ordonner les parties par taille : ordonner les parties par nombre d'occurrences décroissant pour la description des partitions ;
-
Afficher le nombre de parties dans le titre du graphique : afficher le nombre de parties dans le titre des diagrammes à bâton de dimensions de partition.
11.3.7 Édition
-
Mise en évidence robuste des mots (calcul plus lent) : En cas de défauts d’affichage dans la mise en évidence lors du retour au texte.
11.3.8 Explorateur de fichiers
-
Exp. Rég. des fichiers cachés : expression régulière pour filtrer par leur nom certains fichiers dans l’affichage de l’explorateur de fichiers (surtout utilisé pour masquer les fichiers commençant par '.' en Linux) ;
-
Afficher les fichiers cachés : afficher les fichiers considérés comme cachés par le système.
11.3.9 Export
Paramètres pour tous les exports de TXM :
-
Encodage des fichiers d'export : table d'encodage des caractères à utiliser pour l'export. La valeur « UTF-8 » est conseillée car c'est la plus universelle ;
-
Colonnes séparées par : caractère à utiliser comme séparateur de colonnes pour les exports au format CSV (« ; » par défaut). Ce caractère est très variable selon les logiciels tableurs et les systèmes d'exploitation. Bien que « CSV » soit l'acronyme de « Comma Separated Values », la virgule (« , ») est souvent remplacée par point-virgule (« ; ») voire le caractère de tabulation (« →| ») dans ce rôle ;
-
Séparateur de texte : caractère à utiliser comme délimiteur de valeurs de colonnes pour les exports au format CSV (« " » par défaut).
-
Afficher le résultat de l'export dans un éditeur de texte : Si l'export s'est déroulé correctement, le résultat est affiché dans une nouvelle fenêtre de l'éditeur de texte de TXM.
-
Format de fichier d'export des graphiques par défaut : format à utiliser pour l'export des graphiques.
11.3.10 Import
Paramètres de lecture du fichier de métadonnées « metadata.csv » utilisé par certains modules d'import (TXT+CSV, XML/w+CSV, etc.) :
-
Encodage des caractères : table d'encodage des caractères à utiliser. « UTF-8 » par défaut ;
-
Colonnes séparées par : caractère à utiliser comme séparateur de colonnes. « , » par défaut ;
-
Séparateur de texte : caractère à utiliser comme délimiteur de valeurs de colonnes. « " » par défaut.
-
Langue du presse-papier : langue a utiliser pour TreeTagger dans l’import presse-papier ;
-
Code pour les propriétés sans valeur : chaîne de caractères à utiliser pour les valeurs de propriétés non renseignées ;
11.3.11 Partition
-
Ordonner les parties par taille : plutôt que par leur ordre par défaut ;
-
Afficher le nombre de parties dans le titre du graphique : ajoute l’information directement dans le titre ;
11.3.12 Progression
Valeurs par défaut de la fenêtre de paramètres de la progression :
-
Graphe de progression cumulatif : produire un graphe « cumulatif » plutôt que par densité ;
-
Niveau de gris : produire un graphique en niveaux de gris plutôt qu'en couleur (aide à la publication) ;
-
Style de ligne unique : pouvoir utiliser des styles de trait différents (continu, tirets, petits points, etc.) pour chaque courbe (utile pour les graphiques en niveaux de gris) ;
-
Répéter les valeurs de propriétés de structures : par défaut les limites des structures partageant la même valeur de propriété ne sont pas affichées ;
-
Échelle des limites de structures : nombre permettant d'affiner la pente des courbes aux limites de structures dans le graphique en densité.
11.3.13 Références
-
Ordonner les références par fréquence : plutôt que par ordre alphabétique des valeurs.
11.3.14 Scripts
-
Sauvegarder le script avant exécution : Enregistrer le script dans son fichier avant de l’exécuter ;
-
Prochain numéro de session : Les scripts R sont sauvegardés dans des fichiers dont le nom est construit automatiquement. Leur nom est construit avec le n° de session en suffixe. Ce n° est incrémenté à chaque appel de script ;
-
Dossier racine : dossier à partir duquel TXM est autorisé à exécuter les scripts.
11.3.15 Spécificités
-
Format des indices : format d’affichage des indices (à documenter) ;
-
Indice maximum : valeur conventionnelle maximale limite des indices de spécificité ;
-
Banalité : seuil de banalité pour les graphiques ;
-
Regrouper les barres par les lignes de la table : transposer la table lexicale avant de produire le graphique ;
-
Niveaux de gris : produire un graphique en niveaux de gris (pour l’aide à la publication) ;
-
Afficher les lignes : afficher les valeurs d’indices sous forme de lignes brisées ;
-
Afficher les barres : afficher les valeurs d’indices sous forme de diagramme à bâtons.
11.3.16 Table lexicale
-
Fréquence minimale : filtrage des lignes par fréquence minimale lors d'un calcul intermédiaire de table lexicale.
11.3.16.1 Définition du format d'affichage des nombres réels ou entiers55
Dans les tableaux de résultats, les nombres peuvent être formatés selon un patron défini à l'aide des caractères élémentaires suivants :
0 |
représente un chiffre qui devra obligatoirement être présent, même s'il s'agit d'un zéro inutile |
# |
représente un chiffre en ignorant les zéros inutiles |
. |
représente le séparateur de la partie décimale |
, |
représente le séparateur des groupes (milliers, millions, etc.) |
Tableau 2: Caractères de formatage des nombres
Le nombre de « 0 » ou de « # » dans le patron détermine la taille des parties entière et décimale de la valeur numérique, sachant que 0 représentera un chiffre obligatoirement présent (et éventuellement remplacé par un zéro inutile) et # un chiffre optionnel (qui ignorera donc les zéros inutiles). Exemples de formats :
Format |
0 |
0,02 |
0,8 |
12,9 |
### |
0 |
0 |
1 |
13 |
#.## |
0 |
0,02 |
0,8 |
12,9 |
0.## |
0 |
0,02 |
0,8 |
12,9 |
0.00 |
0,00 |
0,02 |
0,80 |
12,90 |
#.00 |
,00 |
,02 |
,80 |
12,90 |
#,##0.00 |
0,00 |
0,02 |
0,80 |
12,90 |
Tableau 3: Exemples de formats de nombres
55 D'après http://java.developpez.com/faq/java/?page=langage_chaine#LANGAGE_STRING_nombre_en_chaine_formatee