Le test de Kruskal-Wallis est un test non paramétrique à utiliser lorsque vous êtes en présence de k échantillons indépendants, afin de déterminer si les échantillons proviennent d'une même population ou si au moins un échantillon provient d'une population différente des autres.
Les tests non paramétriques sont donc utilisés lorsque le niveau d'échelle n'est pas métrique, que la distribution réelle des variables aléatoires n'est pas connue ou que l'échantillon est simplement trop petit pour supposer une distribution normale.
Le test de Kruskal-Wallis n'apporte pas de réponse à la question de savoir lequel des groupes diffère ; un test post-hoc est nécessaire à cet effet. À cette fin, le test de Dunn est le test non paramétrique approprié pour la comparaison multiple par paire.
Quand l’utiliser. L'utilisation la plus courante du test de Kruskal – Wallis est lorsque vous avez une variable nominale et une variable de mesure, une expérience que vous analyseriez habituellement en utilisant une anova unidirectionnelle, mais que la variable de mesure ne répond pas à l'hypothèse de normalité d'une variable unidirectionnelle. anova .
Le test U de Mann-Whitney est donc le pendant non paramétrique du test t pour échantillons indépendants ; il est soumis à des hypothèses moins strictes que le test t. Par conséquent, le test U de Mann-Whitney est toujours utilisé lorsque la condition de distribution normale du test t n'est pas remplie.
Le Test de Wilcoxon est un test de comparaison de deux séries d'une même variable quantitative (même unité de mesure). C'est un Test non paramétrique, utilisé quand les conditions de normalité de la variable ne sont pas valides. C'est l'équivalent du test T de Student.
Lorsque l'un des effectifs théoriques est inférieur à 5 ou lorsque les sommes marginales du jeu de données réel sont très déséquilibrées, il est préférable de se fier au test exact de Fisher.
La distribution normale/gaussienne doit être analysée avec l'ANOVA tandis qu'une distribution non normale/non gaussienne doit être analysée avec Kruskal-Wallis . Cela dépend donc de vos données, pas du nombre de groupes (puisque vous semblez envisager de n'avoir qu'une seule variable indépendante).
Le test H de Kruskal-Wallis (parfois également appelé « ANOVA unidirectionnelle sur les rangs ») est un test non paramétrique basé sur le rang qui peut être utilisé pour déterminer s'il existe des différences statistiquement significatives entre deux ou plusieurs groupes d'une variable indépendante sur un variable dépendante continue ou ordinale .
Interprétation du test de Kruskal-Wallis
La question est de savoir si la valeur p calculée est inférieure ou supérieure au seuil de signification habituellement fixé à 0,05. Si la valeur p est plus grande, l'hypothèse nulle n'est pas rejetée, sinon elle est rejetée . Dans l'exemple ci-dessus, la valeur p est de 0,779 et donc supérieure à 0,05.
Test post-hoc : c'est le test utilisé pour la comparaison par paires de sous-groupes, lorsque le test de Kruskal-Wallis est positif (c'est-à-dire que P est inférieur au seuil de signification choisi, voir ci-dessous).
Le test t est utilisé lorsque vous devez trouver la moyenne de la population entre deux groupes, tandis que lorsqu'il y a trois groupes ou plus, vous optez pour le test ANOVA. Le test t et l'ANOVA sont tous deux des méthodes statistiques permettant de tester une hypothèse.
L'ANOVA à 2 facteurs est généralement employée pour analyser les résultats d'une expérimentation dans laquelle des individus, ou des unités expérimentales, ont été exposées, de façon aléatoire (randomisée), à l'une des combinaisons (ou croisement) des modalités des deux variables catégorielles.
Si la moyenne représente plus précisément le centre de la distribution de vos données et que la taille de votre échantillon est suffisamment grande, utilisez un test paramétrique. Si la médiane représente plus précisément le centre de la distribution de vos données, utilisez un test non paramétrique même si vous disposez d'un échantillon de grande taille .
Définitions. Un test paramétrique est un test pour lequel on fait une hypothèse paramétrique sur la loi des données sous H0 (loi normale, loi de Poisson...); Les hypothèses du test concernent alors les paramètres de cette loi. Un test non paramétrique est un test ne nécessitant pas d'hypothèse sur la loi des données.
Les statistiques paramétriques sont basées sur des hypothèses concernant la répartition de la population à partir de laquelle l'échantillon a été prélevé . Les statistiques non paramétriques ne sont pas basées sur des hypothèses, c'est-à-dire que les données peuvent être collectées à partir d'un échantillon qui ne suit pas une distribution spécifique.
The major difference between the Mann-Whitney U and the Kruskal-Wallis H is simply that the latter can accommodate more than two groups. Both tests require independent (between-subjects) designs and use summed rank scores to determine the results.
Valeur H. H est la statistique du test de Kruskal-Wallis . Sous l'hypothèse nulle, la distribution du chi carré se rapproche de la distribution de H. L'approximation est raisonnablement précise lorsqu'aucun groupe n'a moins de cinq observations.
On peut utiliser ce test avec un échantillon unique pour vérifier si la distribution suit une loi spécifique, ou avec deux échantillons indépendants pour comparer deux distributions différentes. Si la valeur P est supérieure à un seuil de signification prédéfini, l'hypothèse nulle est vérifiée.
Les hypothèses du test de Kruskal-Wallis sont similaires à celles du test de Wilcoxon-Mann-Whitney. Les échantillons sont des échantillons aléatoires ou l'attribution au groupe de traitement est aléatoire. Les deux échantillons sont mutuellement indépendants. L'échelle de mesure est au moins ordinale et la variable est continue .
La statistique de Kruskal-Wallis est basée sur la comparaison des classements moyens de chaque groupe par rapport au classement moyen de toutes les observations .
L'ANOVA est disponible pour les données paramétriques (données de score) et non paramétriques (classement/classement) . L’exemple donné ci-dessus est appelé modèle unidirectionnel entre groupes. Vous regardez les différences entre les groupes. Il n'y a qu'un seul regroupement (note finale) que vous utilisez pour définir les groupes.
Le test du Khi2 peut être employé si tous les effectifs théoriques sont >5. Si au moins un effectif théorique est <5 alors, le test du Khi2 avec correction de Yates, ou bien le test exact de Fisher doivent être employés.
Alors que le test du chi carré repose sur une approximation, le test exact de Fisher est l'un des tests exacts . Surtout lorsque plus de 20 % des cellules ont des fréquences attendues < 5, nous devons utiliser le test exact de Fisher car l'application de la méthode d'approximation est inadéquate.
Le test de Bartlett peut être utilisé pour comparer deux variances ou plus. Ce test est sensible à la normalité des données. Autrement dit, si l'hypothèse de normalité des données semble fragile, on utilisera plutôt le test de Levene ou de Fisher.