8 Analyser un corpus
8.12 Analyse Factorielle des Correspondances (AFC)
Voir aussi la documentation commune à toutes les visualisations dans la section « 8.14 Visualisation graphique des résultats » page 1.
La commande AFC calcule l'analyse factorielle des correspondances (Benzécri, 1979b) d'une table lexicale ou d’une partition.
Dans le cas d’une partition, une table lexicale est d’abord construite à la volée pour ensuite lui appliquer le calcul d’AFC. La construction prend comme paramètres :
-
le nom de la propriété de mot à utiliser pour construire les vecteurs de fréquences (word, *lemma, *pos...) ;
-
le nombre maximum de lignes de la table ;
-
la fréquence totale minimale d’une valeur de propriété pour faire partie de la table.
Dans la table lexicale calculée à la volée, les colonnes correspondent aux parties et contiennent le vecteur colonne des fréquences des valeurs de la propriété de mot choisie, et les lignes contiennent les fréquences au sein de chaque partie d’une des valeurs de la propriété de mot.
Cette commande doit être appliquée à une partition constituée d'au moins quatre parties ou à une table lexicale constituée d’au moins quatre colonnes.
Les résultats sont affichés dans deux vues côte-à-côte :
-
la vue de gauche affiche les résultats sous la forme d’une visualisation graphique des plans factoriels
la vue de droite affiche les résultats détaillés du calcul sous la forme de tableaux. Elle se subdivise en quatre onglets :
les valeurs propres
les informations sur les lignes
les informations sur les colonnes
l'histogramme des valeurs propres

Illustration 8.34 : AFC obtenue à partir d'une table lexicale sur les « Dates » du corpus DISCOURS.
La fenêtre de visualisation des plans factoriels permet de choisir :
-
quel plan est visualisé : choisir dans le menu « Axes : » les axes du plan à visualiser ;
quels éléments sont affichés dans le graphique : cliquez sur les boutons « Afficher les colonnes »
ou « Afficher les lignes »
de la barre d'outils des graphiques selon les points que vous souhaitez visualiser, ensemble ou séparément.
Par défaut, l'AFC affiche seulement les colonnes dans le plan factoriel. Ce paramètre peut être modifié dans les préférences de l'AFC, dans la section « Rendu des graphiques » :« Afficher les lignes » : affiche les propriétés de mot ;
« Afficher les colonnes » : affiche les parties.
L'échelle du graphique peut être modifiée avec la molette de la souris et sa position avec le bouton droit de la souris.
L'échelle et la position du graphique peuvent être réinitialisées en cliquant sur le bouton « Rétablir la vue initiale » .
La vue courante du graphique peut être exportée avec la commande « Exporter la vue » dans différents formats sélectionnables dans la boîte de dialogue de l'export.
Voir également les raccourcis graphique de zoom, déplacement etc. dans la section 8.14.
Dans le volet de droite, diverses informations sont disponibles afin d'aider l'utilisateur à interpréter les coordonnées des colonnes (variables) ou des lignes (individus).
Le tableau des valeurs propres indique leur rang, leur valeur, leur pourcentage d'inertie ainsi que le cumul des pourcentages.
Le graphe en barres des valeurs propres en donne un aperçu analogique.
Les tableaux d'information sur les colonnes et les lignes indiquent :
-
la qualité des plans « Q- »: la représentation du point dans chaque plan, calculée comme la somme des cos² du point sur les deux axes concernés : plus la qualité est proche de 1, moins la position du point est déformée par la projection dans le plan.
-
le poids relatif « Mass »: la fréquence est rapportée à la somme des fréquences des autres mots (lignes).
-
le carré de la distance du point à l'origine « Dist » (l'origine est le centre de gravité du nuage de points : plus la distance est grande, plus le point s'écarte du profil moyen, autrement dit plus il est original par rapport au reste du corpus)
-
la participation du point à la construction de l'axe « Cont- ». La somme des contributions vaut 100 et les points qui présentent les plus fortes contributions pour un axe donné servent à interpréter l'axe.
-
le cos² du point sur chaque axe « Cos² »: la mesure de l'angle entre le vecteur représentatif du point et l'axe. Un cos² proche de 1 indique que le point est bien représenté sur l'axe alors qu'un cos² proche de 0 indique que la projection déforme fortement le point par rapport à cet axe et qu'il vaut mieux donc éviter d'interpréter la position du point par rapport aux autres selon la coordonnée sur cet axe. En particulier, un point qui a un cos² faible sur les deux axes de la représentation choisie a une position trompeuse ; sa proximité apparente avec d'autres points ne doit pas être interprétée dans ce plan.
-
les coordonnées des points dans l'espace des trois premiers axes « c- ».
Les fenêtres de résultats offrent un mécanisme de sélection multiple et de mise en évidence des points combiné entre les points des graphiques et les lignes des tableaux de données. Cliquer sur un point dans le graphique ou dans l'un des tableaux a pour effet de le mettre en surbrillance. La sélection multiple se fait par le mécanisme habituel du système d'exploitation : Ctrl-Clic gauche (Windows et Linux) et Cmd-Clic gauche (Mac OS X) permute entre l'ajout et le retrait d'un point dans la sélection en cours.
La commande de recherche par expression régulière dans un tableau de données (raccourcis Ctrl-F) peut être utilisée conjointement avec la mise en évidence par sélection multiple.

Illustration 8.35 : Exemple de mise en évidence de points par sélection multiple dans une AFC créée depuis une partition sur les présidents dans le corpus VOEUX.
La commande « Exporter la vue » conserve ces sélections multiples dans les fichiers générés.
L'algorithme de la commande AFC est implémenté par le package FactoMineR (Lê, Josse, & Husson, 2008).
Pour de plus amples informations, notamment d'un point de vue R, merci de consulter la documentation de ce package :
-
documentation R officielle :
http://cran.r-project.org/web/packages/FactoMineR/index.html -
manuel PDF :
http://cran.r-project.org/web/packages/FactoMineR/FactoMineR.pdf -
site web de référence : http://factominer.free.fr
-
documentation de référence (dont monographies) : http://factominer.free.fr/docs/index.html