L'objectif de l'analyse factorielle est de représenter les covariances et corrélations entre les variables. L'analyse en composantes principales permet de réduire les données en un nombre inférieur de composantes. L'analyse factorielle permet de comprendre les constructions sous-jacentes aux données.
Quand les variables sont quantitatives, on peut réaliser une ACP (Analyse en Composantes Principales). Quand les individus sont décrits par deux variables qualitatives, on peut construire un tableau de contingence et réaliser une AFC (Analyse Factorielle des Correspondances).
L'analyse en composantes principales (Principal component) est basée sur la variance spécifique des variables et permet d'extraire un minimum de facteurs qui expliquent la plus grande partie possible de la variance spécifique. C'est habituellement la méthode privilégiée.
L'ACP est notamment utilisée pour visualiser des corrélations entre les variables, et identifier des groupes homogènes ou à l'inverse des observations atypiques, en particulier des profils à première vue "cachés" à l'intérieur d'un jeu de données.
Quand faire une analyse factorielle ? Faire une analyse factorielle est pertinent lorsque l'enquête introduit de nombreuses variables dans le questionnaire, soumis à un nombre considérable d'individus. Dans ce contexte, le tableau de données est difficile non seulement à élaborer, mais aussi à analyser.
L'analyse en composantes principales et l'analyse factorielle des correspon- dances sont sans doute les deux méthodes factorielles les plus couramment uti- lisées, mais d'autres méthodes peuvent encore être envisagées. (Unité de Statistique et Informatique).
En mathématiques, la factorielle d'un entier naturel n est le produit des nombres entiers strictement positifs inférieurs ou égaux à n. Cette opération est notée avec un point d'exclamation, n!, ce qui se lit soit « factorielle de n », soit « factorielle n », soit « n factorielle ».
L'AFC sert à analyser le lien entre deux variables qualitatives. On l'utilise quand le nombre de modalités des variables est tel que la lecture du tableau de contingence (comptage des effectifs d'individus dans les cases du tableau croisé) devient complexe, voire impossible.
Le principe est simple : Il s'agit en fait de résumer l'information qui est contenue dans une large base de données en un certain nombre de variables synthétiques appelées : Composantes principales.
Elle prend des valeurs entre 0 (pas corrélé du tout) et 1 (fortement corrélé). Si cette valeur est proche de 1, alors le point est bien représenté sur l'axe. Les points situés près du centre sont donc généralement mal représentés par le plan factoriel. Leur interprétation ne peut donc pas être effectuée avec confiance.
Méthode des composantes principales
La matrice des composantes principales est égale au produit de la matrice des valeurs propres et de la matrice des variables indépendantes. La première composante principale rend compte du plus grand pourcentage de la variation totale des données.
l'ACP non normée dans laquelle les variables quantitatives du tableau sont uniquement centrées (moyenne = 0). l'ACP normée dans laquelle les variables quantitatives du tableau sont préalablement centrées réduites (moyenne = 0 et variance = 1; section 2.5.5.2).
L'ACM permet d'étudier le lien entre ces variables par l'intermédiaire d'un tableau disjonctif complet (TDC) ou du tableau de Burt (TB). Dans ces tableaux de données, les individus (en lignes) sont décrits par un ensemble de variables qualitatives (en colonnes).
Limites de l'ACP
Cependant, en ACP, nous sommes limités aux corrélations linéaires. La corrélation linéaire, c'est celle mesurée par r_{X,Y} , coefficient de Pearson (pour vous rafraîchir la mémoire, c'est par ici).
L'AFC consiste, dans l'une des analyses, à pondérer les pieds par la racine carrée des mains, et dans l'autre analyse, de pondérer les mains par la racine carrée de pieds. marginales et on obtient le même résultat pour les deux analyses lorsque l'on somme tous les calculs.
La valeur propre (ou "eigenvalue") est la somme des carrés de ces saturations. Elle représente la quantité de variance du nuage de points expliquée par cette composante (pour en savoir plus sur la variance d'un nuage de point, cf. le glossaire "NUAGE DE POINTS".
Inertie par case : le tableau des inerties par case est affiché. La somme des inerties est égale à la statistique du khi² divisée par la fréquence totale (somme des cellules du tableau de contingence).
L'inertie est définie comme le Chi² de Pearson total pour une table de fréquences à deux entrées (comme celle que vous pouvez aussi calculer dans les Statistiques Élémentaires ou méthodes d'analyse Log-Linéaire) divisée par la somme totale de toutes les observations de la table.
La notation factorielle permet de simplifier l'écriture de l'opération mathématique à effectuer. Plutôt que d'écrire le produit de tous les nombres entiers impliqués, il suffit d'écrire l'entier dont on veut calculer la factorielle suivi d'un point d'exclamation.
Ainsi pour déterminer la factorielle d'un nombre entier, nous pouvons utiliser la formule suivante : = n × ( n − 1 ) × . . . × 2 × 1 Nous pouvons aussi définir la factorielle d'un nombre par récurrence : = n × ( n − 1 ) !
Créée au début du XX e siècle par Charles Spearman, cette méthode est utilisée en psychologie et particulièrement en psychométrie.
Le modèle d'analyse factorielle exploratoire spécifie que les variables sont déterminées par des facteurs communs (facteurs estimés par le modèle) et des facteurs uniques (qui ne se recoupent pas entre variables observées) ; le calcul des estimations est fondé sur le postulat que les facteurs uniques ne sont pas inter- ...
Les principales étapes du processus d'analyse consistent à cerner les sujets d'analyse, à déterminer la disponibilité de données appropriées, à décider des méthodes qu'il y a lieu d'utiliser pour répondre aux questions d'intérêt, à appliquer les méthodes et à évaluer, résumer et communiquer les résultats.
Étapes de la réalisation d'une EFA
Utilisez-le comme guide de référence lors de la réalisation de votre propre EFA. Identifier le nombre de facteurs à extraire et effectuer une analyse factorielle préliminaire. Faire tourner les facteurs extraits pour simplifier la structure factorielle et augmenter l'interprétabilité.