Monographies générales sur la méthode
Lebart L., Salem A. (1994) - Statistique Textuelle. Dunod, Paris, 342 p.
[consulter – emprunter] 1 – [version auteur disponible en ligne : à Paris 3, sur le site de Dtm-Vic ]
Sommaire
- Préface, Avant propos, Introduction
- Chapitre 1 : Domaines et problèmes
- Chapitre 2 : Les unités de la statistique textuelle
- Chapitre 3 : L’analyse des correspondances
- Chapitre 4 : La classification automatique des formes et des textes
- Chapitre 5 : Typologies, visualisations
- Chapitre 6 : Éléments caractéristiques, réponses ou textes modaux
- Chapitre 7 : Partitions longitudinales, contiguïté
- Chapitre 8 : Analyse discriminante textuelle
- Annexes et fin : Description sommaire de quatre logiciels, Esquisse des algorithmes et structures de données, Glossaire, Références bibliographiques, Index des auteurs.
Lebart L., Salem A., Berry L. (1998) - Exploring Textual Data. Kluwer academic pub., Boston, 222 p.
[adaptation anglaise largement actualisée de l’ouvrage « Statistique Textuelle » – consulter – emprunter]
Articles de référence de modèles textométriques
Guilbaud G-Th. (1980) - Zipf et les fréquences, Mots N° 1, p. 97-126
[consulter en ligne sur Persée]
Lafon P. (1980) - Sur la variabilité de la fréquence des formes dans un corpus, Mots N°1 , p. 127-165
[modèle des spécificités – consulter en ligne sur Persée]
Tournier M. (1980) - D’où viennent les fréquences de vocabulaire ?, Mots N°1, p 189-212.
[lexique, usages, vocabulaire et probabilités – consulter en ligne sur Persée] 2
Lafon P. (1981) - Statistiques des localisations des formes d’un texte, Mots, N° 2, mars 1981, p. 157-188
[modèle des rafales – consulter en ligne sur Persée] 2
Lafon P. (1981) - Analyse lexicométrique et recherche des cooccurrences, Mots N°3 , p. 95-148
[modèle des cooccurrences – consulter en ligne sur Persée] 2
Lafon P., Salem A. (1983) - L’inventaire des segments répétés d’un texte, Mots N°6, p. 161-177
[modèle des segments répétés – consulter en ligne sur Persée] 2
Salem A. (1988) - Approches du temps lexical. Statistique textuelle et séries chronologiques, Mots, 17, octobre 1988, p. 105-143
[modèle des séries chronologiques – consulter en ligne sur Persée] 2
Actes de la conférence JADT
Version électronique des Actes des conférences JADT sur le site Lexicometrica.
Autres références
Brunet, Etienne (1986) - Actes du Colloque international CNRS “Méthodes quantitatives et informatiques dans l’étude des textes” (en hommage à Charles Muller), Genève, Editions Slatkine, XIV- 948 pages
Brunet, Etienne (2006) - “Le corpus conçu comme une boule”,
Corpus en Lettres et Sciences sociales : des documents numériques à l’interprétation, Actes du XVIIe Colloque d’Albi Langages et Signification, Albi, 10-14 juillet 2006, Carine Duteil-Mougel & Baptiste Foulquié (éds), ISBN 2-907955-12-18, pp. 69-78
[accès en ligne dans Texto!, ISSN 1773-0120, juin 2006, vol. XI, n°2]
Brunet, Etienne (2009) - Comptes d’auteurs. Tome I, Etudes statistiques, de Rabelais à Gracq, Textes édités par Damon Mayaffre, préface d’Henri Béhar, Paris, Champion, 2009, 395 pages, ISBN 978-2-7453-2019-3 (premier tome d’une série de trois, rééditant des articles choisis d’Etienne Brunet) [emprunter]
Brunet, Etienne (2011) - Ce qui compte : méthodes statistiques, Textes édités par Céline Poudat, préface de Ludovic Lebart, Paris, Champion, 2011, 371 pages, ISBN 978-2-7453-2225-8 (Écrits choisis, tome II). [emprunter]
Brunet, Etienne (2016) - Tous comptes faits : écrits choisis, tome III, Questions linguistiques, Textes édités par Bénédicte Pincemin, préface de François Rastier, Paris, Champion, 2016, 417 pages, ISBN 978-2-7453-3553-1 (Écrits choisis, tome III). [emprunter, édition numérique]
Fénelon J.P. (1981) - Qu’est-ce-que l’analyse des données ?, Lefonen, Paris. Réédité en 1999 par SEISAM, Paris
[fiches pédagogiques – consulter – emprunter (édition originale) (2e édition)]
Geffroy Annie, Lafon Pierre, Tournier Maurice (1974) - L’indexation minimale, Plaidoyer pour une non-lemmatisation, Colloque sur l’analyse des corpus linguistiques : “Problèmes et méthodes de l’indexation minimale”, Strasbourg 21-23 mai 1973
Husson François, Lê Sébastien & Pagès Jérôme (2009) - Analyse de données avec R, Presse Universitaires de Rennes (ISBN 978-2-7535-0938-2, 15 euros). 2e édition revue et augmentée en 2016, ISBN 978-2-7535-4869-5. [emprunter]
Lafon Pierre (1984) - Dépouillements et statistiques en lexicométrie, Paris : Slatkine-Champion. Avec la préface “De la lemmatisation” de Charles Muller, pp.I-XII
Lebart, Ludovic, Pincemin, Bénédicte et Poudat Céline (2019) - Analyse des données textuelles, Québec, Presses de l’université du Québec, 2019, 472 pages, ISBN 978-2-7605-5052-0. [emprunter, édition numérique]
Luong Xuan (éd.) (2003) - La distance intertextuelle, Corpus, 2
[consulter en ligne sur Revues.org]
Muller Charles (1973) - Initiation aux méthodes de la statistique linguistique, Champion, coll. Unichamp, 1992 (réimpression de l’édition Hachette de 1973)
Muller C. (1977) - Principes et méthodes de statistique lexicale, Hachette, Paris
Née, Émilie (dir.) (2017) - Méthodes et outils informatiques pour l’analyse des discours, Rennes, Presses universitaires de Rennes, 2017, 248 pages, ISBN 978-2-7535-5499-3. [emprunter, édition numérique]
Poudat, Céline, et Landragin, Frédéric (2017) - Explorer un corpus textuel : méthodes, pratiques, outils, Louvain-la-Neuve : De Boeck Supérieur, 2017, 239 pages, ISBN 978-2-8073-0563-2 [emprunter, édition numérique]
Tournier Maurice (1985a) - « Sur quoi pouvons-nous compter ? Réponse à Charles Muller », Verbum, hommage à Hélène Nais, pp. 481-492
Viprey J.-M. (2002) - Analyses textuelles et hypertextuelles des Fleurs du mal, Champion, Paris
Volle M. (1980) - Analyse des données, Economica, Paris
Manuels de logiciels liés au projet ANR Textométrie
Quelques thèses
Beaudouin Valérie (2002) – Mètre et rythmes du vers classique. Corneille et Racine, Paris : Champion, coll. « Lettres numériques »
Bourion E. (2001). L’aide à l’interprétation des textes électroniques. Thèse de doctorat, Sciences du langage, Université de Nancy II
Martinez William (2003) - Contribution à une méthodologie de l’analyse des cooccurrences lexicales multiples dans les corpus textuels, Thèse de troisième cycle, Université de Paris 3 Sorbonne Nouvelle, décembre 2003
Zimina-Poirot Maria (2004) - Approches quantitatives de l’extraction de ressources traductionnelles à partir de corpus parallèles, Thèse pour le Doctorat en Sciences du langage, Université de la Sorbonne nouvelle - Paris 3, soutenue le 26 novembre 2004, 328 p.