L'analyse factorielle des correspondances simples peut être en effet considérée comme une méthode d'approfondissement du calcul du khi-deux. L'AFC est mise en œuvre si et seulement si l'hypothèse d'indépendance entre les variables, par le test du khi-deux, est rejetée.
L'Analyse Factorielle des Correspondances (AFC) est une méthode factorielle de Statistique Descriptive Multidimensionnelle (MDS). Elle est utlisée lorsque l'on souhaite étudier la liaison entre deux variables qualitatives (nominales). Dans le cas, d'un jeu de données à plus de 2 variables, on aura recours à l' ACM.
L'AFC sert à analyser le lien entre deux variables qualitatives. On l'utilise quand le nombre de modalités des variables est tel que la lecture du tableau de contingence (comptage des effectifs d'individus dans les cases du tableau croisé) devient complexe, voire impossible.
Sur le plan mathématique, les p axes d'inertie maximale ne sont rien d'autres que les vecteurs propres de la matrice des corrélations entre les variables alors que les sommes des projections des points sur chacun des axes sont les valeurs propres.
Le coude de Cattell constitue un critère plus sévère pour déterminer le nombre de facteurs. Il est possible de demander dans les options associées à l'ACP de réaliser un graphique à partir des valeurs propres. Tous les points représentent les valeurs propres des composantes.
l'ACP est utilisé sur un tableau de données où toutes les variables sur tous les individus sont numériques. L'AFC, elle, s'utilise avec des variables qualitatives qui possèdent deux ou plus de deux modalités. L'AFC offre une visualisation en deux dimensions des tableaux de contingence.
Le principe est simple : Il s'agit en fait de résumer l'information qui est contenue dans une large base de données en un certain nombre de variables synthétiques appelées : Composantes principales.
s'il est immobile ou en mouvement rectiligne uniforme alors la somme des forces qui s'exercent sur ce système se compensent c'est ça le principe d'inertie il permet de faire un lien entre le mouvement d'un système et les forces qui s'exercent sur lui.
L'analyse en composantes principales et l'analyse factorielle des correspon- dances sont sans doute les deux méthodes factorielles les plus couramment uti- lisées, mais d'autres méthodes peuvent encore être envisagées. (Unité de Statistique et Informatique).
C'est un système qui n'est soumis à aucune force extérieure. C'est un système qui est soumis à des forces extérieures qui se compensent à chaque instant. Exemple : solide posé sur une table à coussin d'air. Lançons le mobile sur la table à coussin d'air.
Dans un modèle d'entreprise, l'analyse factorielle est utilisée pour expliquer des variables ou des données complexes à l'aide d'une matrice d'association. Elle étudie les interdépendances des données et suppose que les variables complexes peuvent être réduites à quelques dimensions importantes.
L'objectif de l'analyse des données est d'extraire une information statistique qui permet de cerner plus précisément le profil de la donnée. Les résultats obtenus permettent ensuite d'optimiser la stratégie de la société en question en ajustant certains points.
Inertie par case : le tableau des inerties par case est affiché. La somme des inerties est égale à la statistique du khi² divisée par la fréquence totale (somme des cellules du tableau de contingence).
Q'est-ce que la fonction factorielle? La fonction factorielle est une formule mathématique représentée par le point d'exclamation “!”. Dans la formule factorielle se multiplient tous les numéros entiers et positifs entre le numéro apparu dans la formule, et 1.
L'objectif de l'analyse factorielle est de représenter les covariances et corrélations entre les variables. L'analyse en composantes principales permet de réduire les données en un nombre inférieur de composantes. L'analyse factorielle permet de comprendre les constructions sous-jacentes aux données.
Calculer la qualité de représentation d'un individu sur un plan factoriel (le premier, par exemple), c'est calculer la qualité de représentation du point par l'axe F1, puis par l'axe F2. Cette qualité s'exprime par le pourcentage d'inertie du point qui est expliqué par l'axe.
Les principales étapes du processus d'analyse consistent à cerner les sujets d'analyse, à déterminer la disponibilité de données appropriées, à décider des méthodes qu'il y a lieu d'utiliser pour répondre aux questions d'intérêt, à appliquer les méthodes et à évaluer, résumer et communiquer les résultats.
Une valeur de 1 correspond au cas où les moyennes des classes sont égales. Une valeur faible s'interprète comme de faibles variations intra-classe et donc de fortes variations inter-classes, d'où une différence significative des moyennes des classes.
Les quatre caractéristiques d'une force sont : direction, sens, intensité et point d'application. 3. Pour représenter une force, on doit dessiner une flèche qui possède les mêmes caractéristiques que la force (direction, sens, valeur) et qui commence au point d'application.
1. Propriété de la matière qui fait que les corps ne peuvent d'eux-mêmes modifier leur état de mouvement. 2. Manque d'énergie, d'activité : L'inertie des bureaux entrave toutes les initiatives.
Lorsqu'un système est en chute libre, il n'est soumis qu'à son poids : on peut alors négliger les forces de frottement. D'après la contraposée du principe d'inertie, comme il n'est soumis qu'à son poids les forces ne se compensent pas et la variation du vecteur vitesse est non nulle.
Limites de l'ACP
Cependant, en ACP, nous sommes limités aux corrélations linéaires. La corrélation linéaire, c'est celle mesurée par r_{X,Y} , coefficient de Pearson (pour vous rafraîchir la mémoire, c'est par ici).
Elle permet au statisticien de résumer l'information en réduisant le nombre de variables. premiers axes de l'analyse en composantes principales sont un meilleur choix, du point de vue de l'inertie ou de la variance.
l'ACP non normée dans laquelle les variables quantitatives du tableau sont uniquement centrées (moyenne = 0). l'ACP normée dans laquelle les variables quantitatives du tableau sont préalablement centrées réduites (moyenne = 0 et variance = 1; section 2.5.5.2).