TDM80J
Le corpus TDM80J est composé du texte « Le tour du monde en quatre vingt jours » de Jules Verne (1873), soit 71.927 mots pour 1 texte.
Il s’agit de l’édition J. Hetzel et Compagnie, 1873, transcrite par Wikisource et encodée en XML-TEI P5 par Serge Heiden pour le projet Textométrie.
Le corpus contient une édition synoptique affichant côte-à-côte l’édition TEI du texte, incluant les images des illustrations du livre, et les images du fac-similé du livre du site Wikisource.
- corpus binaire : À charger dans TXM avec « Fichier > Charger > Un corpus binaire (.txm)… ». Le texte a été lemmatisé et étiqueté morpho-syntaxiquement par TreeTagger ;
- sources : à importer dans TXM avec « Fichier > Importer > XML-TEI Zero + CSV ».
La transcription Wikisource est dans le domaine public. Le texte source XML-TEI P5 et le corpus binaire TXM sont sous licence Attribution-NonCommercial-ShareAlike 3.0 Unported (CC BY-NC-SA 3.0).