7 Corpus exemples livrés avec TXM

7.1 Le corpus VOEUX

Le corpus «VOEUX» a été édité par Jean-Marc Leblanc du laboratoire Céditec (Centre d’étude des discours, images, textes, écrits, communication) à Créteil Val de Marne. Il est composé de 54 transcriptions de vœux présidentiels aux caractéristiques suivantes :

Chaque transcription a été lemmatisée avec le logiciel TreeTagger en utilisant le modèle fr.par. Le jeu d'étiquettes morpho-syntaxiques est décrit sur le site de TreeTagger : http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/data/french-tagset.html.

Le corpus est composé des éléments suivants :