Les analyses factorielles sont conduites à partir de tableaux de données parfois gigantesques : si l'on observe cent mille individus caractérisés par trente variables, on place les points-individus, qui sont autant de vecteurs, dans un espace d'au plus trente dimensions.
Les méthodes d`analyse factorielle sont des outils très pertinents dans la mise en évidence des relations entre variables et, plus généralement, dans la compréhension des données à modéliser. On parle souvent de matrice des données brutes, notée R.
La première étape de l'analyse factorielle consiste à sélectionner les variables prises en compte par l'analyse, à savoir d'une part les variables « actives », c'est-à-dire celles qui contribuent au calcul des facteurs et donc à la construction des plans factoriels et de leur représentation graphique, et d'autre part ...
La corrélation de chaque point sur un axe exprime la qualité de représentation du point sur l'axe. Elle prend des valeurs entre 0 (pas corrélé du tout) et 1 (fortement corrélé). Si cette valeur est proche de 1, alors le point est bien représenté sur l'axe.
Pour interpréter l'AFC, la première étape consiste à évaluer s'il existe une dépendance significative entre les lignes et les colonnes. Une méthode rigoureuse consiste à utiliser la statistique de khi2 pour examiner l'association entre les modalités des lignes et celles des colonnes.
Les axes factoriels sont juste triés en ordre décroissant de significativité et c'est l'analyste qui choisit de n'en retenir qu'un certain nombre. Une partie de l'information est volontairement perdue. Le but est double : expliquer les phénomènes analysés de façon plus synthétique et obtenir des modèles robustes.
L'AFC sert à analyser le lien entre deux variables qualitatives. On l'utilise quand le nombre de modalités des variables est tel que la lecture du tableau de contingence (comptage des effectifs d'individus dans les cases du tableau croisé) devient complexe, voire impossible.
D'une part car les données sont complexes à organiser entre elles, d'autre part en raison de leur volume. Il est nécessaire de simplifier. L'analyse factorielle permet de réduire le nombre de variables, pour mettre en évidence et hiérarchiser les seuls facteurs qui provoquent de la variance de manière significative.
Comment calculer les composantes principales ACP ? L'APC passe par le calcul de la matrice des composantes principales. Il s'agit du produit de la matrice des valeurs propres et de la matrice des variables indépendantes.
Représente la qualité de représentation des variables sur le graphique de l'ACP. Il est calculé comme étant les coordonnées au carré: var. cos2 = var. coord * var.
l'ACP est utilisé sur un tableau de données où toutes les variables sur tous les individus sont numériques. L'AFC, elle, s'utilise avec des variables qualitatives qui possèdent deux ou plus de deux modalités. L'AFC offre une visualisation en deux dimensions des tableaux de contingence.
Sélectionner les variables numériques choisies pour l'ACP (minimum : 2 variables) parmi celles figurant dans la liste source en les transférant dans la liste des Variables à l'aide du bouton. Il suffit alors de cliquer sur le bouton OK pour effectuer une analyse factorielle avec les paramètres prévus par défaut.
Cette notation a été introduite en 1808 par Christian Kramp. Par exemple, la factorielle 10 exprime le nombre de combinaisons possibles de placement des 10 convives autour d'une table (on dit la permutation des convives). Le premier convive s'installe sur l'une des 10 places à sa disposition.
Créée au début du XX e siècle par Charles Spearman, cette méthode est utilisée en psychologie et particulièrement en psychométrie.
L'indice KMO de 0,81 peut être qualifié d'excellent ou de méritoire. Il nous indique que les corrélations entre les items sont de bonne qualité. Ensuite, le résultat du test de sphéricité de Bartlett est significatif (p < 0,0005).
L'inertie est donc aussi égale à la somme des variances des variables étudiées. Dans le cas où les variables sont centrées réduites, la variance de chaque variable vaut 1. L'inertie totale est alors égale à p (nombre de variables).
Elle permet au statisticien de résumer l'information en réduisant le nombre de variables. premiers axes de l'analyse en composantes principales sont un meilleur choix, du point de vue de l'inertie ou de la variance.
Sélectionner les données sur la feuille Excel. Cocher l'option Libellés des variables, car la première ligne de données contient le nom des variables. Sélectionner Observations/Variables dans le champ Format des données. Sélectionner Corrélation dans le champ Type d'ACP.
4L'analyse typologique est une technique d'analyse qui a pour objet de regrouper les sujets/objets, de telle sorte que chaque groupe de sujets/objets soit le plus homogène possible sur les variables utilisées et diffère des autres groupes sur ces mêmes variables.
L'analyse factorielle exploratoire (AFE) représente une famille de méthodes quantitatives par lesquelles on cherche `a comprendre un ensemble de variables observées en termes de dimensions plus abstraites qu'on appelle fac- teurs.
Quand les variables sont quantitatives, on peut réaliser une ACP (Analyse en Composantes Principales). Quand les individus sont décrits par deux variables qualitatives, on peut construire un tableau de contingence et réaliser une AFC (Analyse Factorielle des Correspondances).
Les nuages de points en ACM. Comme toute analyse factorielle, l'ACM peut s'interpréter géométriquement à partir d'un nuage dont les points représentent les lignes (ou les colonnes) du tableau analysé.
Une fois XLSTAT lancé, cliquez sur l'icône Préparation des données et choisissez la fonction Tableau disjonctif complet ou dans la barre d'outils Préparation des données sélectionnez l'icone Tableau disjonctif complet (ci-dessous).
La matrice de corrélation indique les valeurs de corrélation, qui mesurent le degré de relation linéaire entre chaque paire de variables. Les valeurs de corrélation peuvent être comprises entre -1 et +1. Si les deux variables ont tendance à augmenter et à diminuer en même temps, la valeur de corrélation est positive.