Lorsque les échantillons peuvent être considérés indépendants, on applique le test de Mann et Whitney pour 2 échantillons, celui de Kruskal et Wallis pour un nombre quelconque d'échantillons. Lorsque on a affaire à deux échantillons appariés (c'est-à-dire non indépendants), on applique le test de Wilcoxon.
Le test U de Mann-Whitney est donc le pendant non paramétrique du test t pour échantillons indépendants ; il est soumis à des hypothèses moins strictes que le test t. Par conséquent, le test U de Mann-Whitney est toujours utilisé lorsque la condition de distribution normale du test t n'est pas remplie.
Le test de Wilcoxon compare deux séries ou groupes de données d'une même variable quantitative ou semi-quantitative. Il s'applique lorsque nous ne pouvons pas utiliser le test T de Student car les conditions de normalité des données ne sont pas validées.
Pour calculer le test de Wilcoxon pour deux échantillons dépendants, on calcule d'abord la différence entre les valeurs dépendantes. Une fois les différences calculées, les valeurs absolues des différences sont utilisées pour former les classements.
Les tests non paramétriques sont donc utilisés lorsque le niveau d'échelle n'est pas métrique, que la distribution réelle des variables aléatoires n'est pas connue ou que l'échantillon est simplement trop petit pour supposer une distribution normale.
Un test paramétrique est un test pour lequel on fait une hypothèse paramétrique sur la loi des données sous H0 (loi normale, loi de Poisson...); Les hypothèses du test concernent alors les paramètres de cette loi. Un test non paramétrique est un test ne nécessitant pas d'hypothèse sur la loi des données.
Interpréter les résultats: après avoir effectué le test de Wilcoxon, il est important d'interpréter les résultats.La valeur p indique la probabilité d'observer une différence aussi extrême que celle observée, en supposant que l'hypothèse nulle est vraie.Si la valeur p est inférieure au niveau de signification ( ...
En statistique, le test de Wilcoxon-Mann-Whitney (ou test U de Mann-Whitney ou encore test de la somme des rangs de Wilcoxon) est un test statistique non paramétrique qui permet de tester l'hypothèse selon laquelle les distributions de chacun de deux groupes de données sont proches.
En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort qu'une différence existe. Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez rejeter l'hypothèse nulle.
Tests non paramétriques
Pour statuer sur la significativité de l'écart de la médiane à la médiane théorique, il suffit donc de vérifier si la fréquence de 11 fois sur 14 est significativement différente de 50%. On observe que cet écart est limite.
Par exemple, si vous voulez comparer une moyenne observée à une valeur théorique : Vous souhaitez comparer la moyenne des notes en mathématiques d'une classe à la moyenne du pays ? Dans ce cas nous allons utiliser un test paramétrique car nous pouvons supposer que les données suivent une distribution normale.
Lorsque les échantillons peuvent être considérés indépendants, on applique le test de Mann et Whitney pour 2 échantillons, celui de Kruskal et Wallis pour un nombre quelconque d'échantillons. Lorsque on a affaire à deux échantillons appariés (c'est-à-dire non indépendants), on applique le test de Wilcoxon.
Un test non paramétrique est un test d'hypothèse qui n'exige pas que la distribution de la population soit caractérisée par certains paramètres. Par exemple, de nombreux tests d'hypothèse supposent que la population obéit à une loi normale pour les paramètres µ et σ.
Le test exact de Fisher calcule la probabilité d'obtenir les données observées (en utilisant une distribution hypergéométrique) ainsi que les probabilités d'obtenir tous les jeux de données encore plus extrêmes sous l'hypothèse nulle. Ces probabilités sont utilisées pour calculer la p-value.
Etant une alternative non paramétrique à l'ANOVA sur mesures répétées, le test de Friedman doit être employé lorsque l'hypothèse de normalité des résidus n'est pas satisfaite. Cette situation se rencontre classiquement lorsque la variable réponse est un score, ou encore une variable ordinale comme un classement.
Vous pouvez utiliser le test exact de Fisher pour analyser un tableau de contingence 2 x 2 et vérifier si la variable de ligne et celle de colonne sont indépendantes (H 0 : la variable de ligne et celle de colonne sont indépendantes).
Le test de Kruskal-Wallis est un test non paramétrique à utiliser lorsque vous êtes en présence de k échantillons indépendants, afin de déterminer si les échantillons proviennent d'une même population ou si au moins un échantillon provient d'une population différente des autres.
Paramétrer un test de Mann-Whitney avec XLSTAT
Une fois que XLSTAT-Pro est activé, cliquez sur le menu XLSTAT / Tests non paramétriques / Comparaison de 2 échantillons (Wilcoxon, Mann-Whitney…). Une fois le bouton cliqué, la boîte de dialogue apparaît. Vous pouvez alors sélectionner les données sur la feuille Excel.
Qu'est-ce que la significativité statistique ? La significativité statistique, ou seuil de signification, désigne le seuil à partir duquel les résultats d'un test sont jugés fiables. Autrement dit, ce seuil détermine la confiance dans la corrélation entre un test effectué et les résultats obtenus.
Si la valeur p du test de Levene est supérieure à 0,05, alors les variances ne sont pas significativement différentes les unes des autres (c'est-à-dire que l'hypothèse d'homogénéité de la variance est satisfaite).
Conditions d'application du test de Kruskal-Wallis
Pour calculer un test de Kruskal-Wallis, il suffit de disposer de plusieurs échantillons aléatoires indépendants présentant au moins des caractéristiques à échelle ordinale. Les variables ne doivent pas nécessairement satisfaire à une courbe de distribution.
Les trois tests de corrélation les plus utilisés sont ceux de Spearman, Kendall et Pearson. Les deux premiers sont des tests non-paramétriques que l'on peut également appliquer sur des variables qualitatives ordinales.
S'il génère une valeur p inférieure ou égale au niveau de signification, un résultat est alors défini comme statistiquement significatif et ne sera donc pas considéré comme un événement fortuit. Cela est généralement écrit sous la forme suivante : p≤0,05.
La significativité d'un coefficient est testée à partir du t de Student. On teste l'hypothèse d'un coefficient nul contre l'hypothèse alternative d'un coefficient différent de zéro (positif ou négatif, le test étant bilatéral). Un coefficient sera significatif si la probabilité est inférieure au seuil de 5%.