General Monographs on Methodology

Lebart L., Salem A., Berry L. (1998) - Exploring Textual Data. Kluwer academic pub., Boston, 222 p.
[english translation and adaptation of « Statistique Textuelle » – consultborrow]

Lebart L., Salem A. (1994) - Statistique Textuelle. Dunod, Paris, 342 p.
[consultborrow] 1 – [author versions available online: at ENST, at Paris 3 ]

Reference Article for each Text Analysis Model

Guilbaud G-Th. (1980) - Zipf et les fréquences, Mots N° 1, p. 97-126
[zipf law –online access on the Persée portal]

Lafon P. (1980) - Sur la variabilité de la fréquence des formes dans un corpus, Mots N°1 , p. 127-165
[specificity model – online access on the Persée portal]

Tournier M. (1980) - D’où viennent les fréquences de vocabulaire ?, Mots N°1, p 189-212.
[lexicon, usages, vocabulary and probabilities – online access on the Persée portal] 2

Lafon P. (1981) - Statistiques des localisations des formes d’un texte, Mots, N° 2, mars 1981, p. 157-188
[bursts model – online access on the Persée portal] 2

Lafon P. (1981) - Analyse lexicométrique et recherche des cooccurrences, Mots N°3 , p. 95-148
[cooccurrency model – online access on the Persée portal] 2

Lafon P., Salem A. (1983) - L’inventaire des segments répétés d’un texte, Mots N°6, p. 161-177
[repeated segments model – online access on the Persée portal] 2

Salem A. (1988) - Approches du temps lexical. Statistique textuelle et séries chronologiques, Mots, 17, octobre 1988, p. 105-143
[chronological series model – online access on the Persée portal] 2

JADT Conference proceedings

Electronic edition of the JADT Conference proceedings available on the Lexicometrica website.

Other References

Brunet, Etienne (1986) - Actes du Colloque international CNRS “Méthodes quantitatives et informatiques dans l’étude des textes” (en hommage à Charles Muller), Genève, Editions Slatkine, XIV- 948 pages

Brunet, Etienne (2006) - “Le corpus conçu comme une boule”, Corpus en Lettres et Sciences sociales : des documents numériques à l’interprétation, Actes du XVIIe Colloque d’Albi Langages et Signification, Albi, 10-14 juillet 2006, Carine Duteil-Mougel & Baptiste Foulquié (éds), ISBN 2-907955-12-18, pp. 69-78
[online access in Texto!, ISSN 1773-0120, juin 2006, vol. XI, n°2]

Brunet, Etienne (2009) - Comptes d’auteurs. Etudes statistiques de Rabelais à Gracq, Textes édités par Damon Mayaffre, préface d’Henri Béhar, Paris, Champion, 2009, 396 pages, ISBN 274532019X (reedition of selected papers)

Brunet, Etienne (2011) - Ce qui compte. Ecrits choisis, Textes édités par Céline Poudat, préface de Ludovic Lebart, Paris, Champion, 2011, 396 pages, ISBN 2745322257 (reedition of selected papers)

Fénelon J.P. (1981) - Qu’est-ce-que l’analyse des données ?, Lefonen, Paris. Réédité en 1999 par SEISAM, Paris
[teaching aid – consultborrow (first edition) (2nd edition)]

Geffroy Annie, Lafon Pierre, Tournier Maurice (1974) - L’indexation minimale, Plaidoyer pour une non-lemmatisation, Colloque sur l’analyse des corpus linguistiques : “Problèmes et méthodes de l’indexation minimale”, Strasbourg 21-23 mai 1973

Husson François, Lê Sébastien & Pagès Jérôme (2009) - Analyse de données avec R, Presse Universitaires de Rennes (ISBN 978-2-7535-0938-2, 15 euros).

Lafon Pierre (1984) - Dépouillements et statistiques en lexicométrie, Paris : Slatkine-Champion. Avec la préface “De la lemmatisation” de Charles Muller, pp.I-XII

Luong Xuan (éd.) (2003) - La distance intertextuelle, Corpus, 2
[online access on the Revues.org portal]

Muller Charles (1973) - Initiation aux méthodes de la statistique linguistique, Champion, coll. Unichamp, 1992 (reprint of 1973 Hachette edition)

Muller C. (1977) - Principes et méthodes de statistique lexicale, Hachette, Paris

Tournier Maurice (1985a) - « Sur quoi pouvons-nous compter ? Réponse à Charles Muller », Verbum, hommage à Hélène Nais, pp. 481-492

Viprey J.-M. (2002) - Analyses textuelles et hypertextuelles des Fleurs du mal, Champion, Paris

Volle M. (1980) - Analyse des données, Economica, Paris

User’s Manual of Software from ANR Textometrie project participants

Not so old PhD Thesis

Beaudouin Valérie (2002) – Mètre et rythmes du vers classique. Corneille et Racine, Paris : Champion, coll. « Lettres numériques »

Bourion E. (2001). L’aide à l’interprétation des textes électroniques. Thèse de doctorat, Sciences du langage, Université de Nancy II

Martinez William (2003) - Contribution à une méthodologie de l’analyse des cooccurrences lexicales multiples dans les corpus textuels, Thèse de troisième cycle, Université de Paris 3 Sorbonne Nouvelle, décembre 2003

Zimina-Poirot Maria (2004) - Approches quantitatives de l’extraction de ressources traductionnelles à partir de corpus parallèles, Thèse pour le Doctorat en Sciences du langage, Université de la Sorbonne nouvelle - Paris 3, soutenue le 26 novembre 2004, 328 p.

Notes

  1. Click on “Where to find this document ?” to get the list of libraries where to borrow the reference in France. 

  2. Not implemented in TXM as of 30 Avril 2010.  2 3 4 5