Initiation à l'analyse de corpus de textes avec le logiciel ouvert TXM
22 avril 2026, 9h30-17h30
Serge Heiden (IHRIM, ENS de Lyon)
URFIST de Lyon
| Accès rapides |
|
Wiki des utilisateurs de TXM
Liste de diffusion txm-users FAQ Bibliothèque de fichiers pour TXM Wiki des développeurs de TXM Liste anglophone txm-open Sources du logiciel TXM |
| Actualités |
![]() |
La version 0.8.4 du logiciel TXM pour poste a été livrée le 12 février 2025 La version 0.6.3.2 du logiciel portail TXM a été livrée le 13 février 2025 |
La textométrie, née en France dans les années 80, a développé des techniques puissantes et originales pour l’analyse de grands corpus de textes. Reprenant les acquis de la lexicométrie et de la statistique textuelle, elle propose des outils et des méthodes éprouvés dans de multiples branches des SHS et statistiquement solidement fondés.
Le projet Textométrie fédère les développements logiciels open-source du domaine pour mettre en place une plateforme modulaire appelée TXM. Il s’agit à la fois d’une opération patrimoniale au rayonnement international et du lancement d’une nouvelle génération de recherche textométrique, en synergie avec les technologies de corpus actuelles (Unicode, XML, TEI, outils de TAL, CQP, R).
La plateforme TXM est diffusée gratuitement sous licence open-source <Licence publique générale GNU, version 2 et plus> par le biais de deux applications différentes,
Pour les systèmes d’exploitation :
La logiciel TXM pour poste vous permet d’importer vos propres corpus et de les analyser sur votre propre machine.
Voir la page de téléchargement du logiciel pour la version pour poste.
Le logiciel portail web de TXM permet de donner accès à des corpus en ligne par le biais de simples navigateurs web sans avoir à installer TXM sur sa propre machine. Il permet des contrôles d’accès paramétrables par comptes utilisateurs. Il s’installe sur un serveur web de façon analogue au logiciel de blog Wordpress: les articles étant remplacés par des corpus de textes et la navigation dans les articles par des outils d’exploration et d’analyse textométriques.
Voir des exemples de portails publics en ligne.
Voir la page de téléchargement du logiciel pour la version portail web.
Grâce à sa license de diffusion open-source, n’importe qui peut :
Les sources du logiciel sont disponibles à cette URL :
Si vous utilisez TXM pour vos travaux de recherche, merci de citer l'une des deux références suivantes dans vos publications. Ceci est important pour la pérennisation du développement de la plateforme :
| Heiden Serge, Magué Jean-Philippe, & Pincemin Bénédicte. (2010). TXM : Une plateforme logicielle open-source pour la textométrie – conception et développement. JADT 2010 : 10th International Conference on the Statistical Analysis of Textual Data, 1021–1032. http://halshs.archives-ouvertes.fr/docs/00/54/97/79/PDF/Heiden_al_jadt2010.pdf |
| Heiden Serge. (2010). The TXM Platform: Building Open-Source Textual Analysis Software Compatible with the TEI Encoding Scheme. 24th Pacific Asia Conference on Language, Information and Computation, 389–398. http://halshs.archives-ouvertes.fr/docs/00/54/97/64/PDF/paclic24_sheiden.pdf |
Venez dialoguer sur :
Le développement de TXM est soutenu par une communauté de partenaires.
Nous sommes toujours ravis de recevoir des nouvelles de l’utilisation de la plateforme ou de répondre à des questions la concernant, nos coordonnées sont ici.