Installations à faire sur son portable en vue d’un atelier TXM

Les objectifs de l’atelier Initiation à TXM sont non seulement de vous apprendre à utiliser TXM, mais aussi de vous permettre de le faire dans votre propre environnement de travail, et de repartir de la formation avec un TXM bien installé et bien configuré (la configuration de certaines fonctionnalités, comme l’export de résultats, est finalisée pendant l’atelier).

C’est pourquoi nous recommandons à chacun :

  • de venir avec un ordinateur portable, et
  • d’installer TXM et le logiciel associé TreeTagger avant de venir, pour éviter de prendre sur le temps collectif de la séance. En général, pour les ateliers ne durant qu’une journée, il n’est pas prévu de prendre du temps pour procéder à des installations de TXM le jour même.

L’installation n’est a priori pas compliquée, mais comme TXM s’installe dans une très grande diversité d’environnements on peut toujours avoir des surprises, d’où notre prudence.

Voici les informations utiles pour les installations.

Installation et vérification de TXM

Les instructions de téléchargement et d’installation de la version courante sont sur le site de TXM. Voici un lien direct vers la page :

Dans cette page, cliquer sur la grosse flèche verte située au début pour accéder à la dernière version du logiciel.

Une fois la procédure d’installation terminée, vous pouvez faire une première vérification de la bonne installation de TXM :

Par ailleurs, le manuel de TXM est disponible en ligne.

Installation et vérification de l’extension TreeTagger

Les instructions d’installation de l’extension TreeTagger (pour l’étiquetage morphosyntaxique et la lemmatisation des textes) sont indiquées à la page suivante :

Vous pouvez ensuite tester que TreeTagger est opérationnel dans votre TXM pour le modèle du français, que nous utiliserons dans l’atelier :

LibreOffice

Les tableaux de résultats exportés par TXM -vus dans l’atelier initiation-, comme l’import de tableaux de métadonnées pour vos corpus -vu au moment de l’atelier Préparation de corpus et import-, utilisent le format de fichier .csv, .ods ou .xlsx. Pour la manipulation de fichiers CSV, il est recommandé d’avoir LibreOffice ou OpenOffice installé sur son ordinateur :

Il est possible d’utiliser un autre tableur comme Excel, mais cela est souvent beaucoup plus compliqué (Excel “cache” beaucoup de paramètres pour simplifier l’usage courant), et nous n’avons généralement pas le temps en séance pendant l’atelier de résoudre toutes les complications qui peuvent se présenter pour les différents environnements. On trouvera néanmoins de l’aide sur la FAQ pour certaines questions, par exemple :

Corpus de travail pour l’atelier d’initiation

Corpus commun (indispensable)

L’Atelier d’initiation utilise le corpus VOEUX. Ce corpus est pré-installé dans TXM, comme corpus exemple. Lors du premier lancement de TXM, il faut bien sûr accepter son installation.

Un document que vous choisissez pour un import dans TXM (facultatif)

Pendant l’atelier Initiation, nous expérimenterons l’import le plus simple, dit “presse-papier”, reposant sur un simple copier/coller.

Autant que vous en profitiez pour voir ce que cela donne sur l’un de vos fichiers. Vous pouvez donc juste réfléchir avant de venir à apporter dans votre ordinateur un fichier représentant un texte (au sens large : ce peut être une transcription par exemple) d’une dizaine de pages (disons entre trois et cent !), ou un petit corpus (ou un échantillon d’un grand corpus) mis sous la forme d’un seul fichier, dans la langue de votre choix (il peut être intéressant que ce soit une langue pour laquelle vous avez installé un modèle TreeTagger). Prenez un format où la commande “copier” fonctionne : un fichier que vous ouvrez dans votre traitement de texte (.doc, .docx, .rtf, .odt, .txt…), une page web (plutôt longue) ; évitez les .pdf ou vérifiez avant que le texte peut être sélectionné et copié (pas de pdf “image”).

Archive de supports de cours et de corpus exemples pour l’atelier préparation et import de corpus

Pour l’atelier préparation et import de corpus télécharger et dézipper l’archive de supports de cours et de corpus exemples depuis l’adresse suivante :

Aide

Si vous avez des difficultés à installer TXM, que vous avez bien consulté les Réponses aux Questions les plus Fréquentes (FAQ) (pour toutes les questions concernant l’installation et le lancement), et que votre entourage professionnel ou personnel ne peut pas vous aider, contactez-nous (textometrie AT groupes.renater.fr).

  1. Si vous avez une version précédente de TXM installée sur votre ordinateur, il est recommandé de télécharger et d’installer la nouvelle version. La version déjà installée de TXM restera disponible, ainsi que ses corpus. 

  2. La FAQ est constamment en évolution donc pensez à consulter sa dernière version quand vous en avez besoin.