Un test paramétrique est un test pour lequel on fait une hypothèse paramétrique sur la loi des données sous H0 (loi normale, loi de Poisson...). Les hypothèses du test concernent alors les paramètres de cette loi. Un test non paramétrique est un test ne nécessitant pas d'hypothèse sur la loi des données.
Les trois tests de corrélation les plus utilisés sont ceux de Spearman, Kendall et Pearson. Les deux premiers sont des tests non-paramétriques que l'on peut également appliquer sur des variables qualitatives ordinales.
Les plus populaires sont l'AIC (Akaike's Information Criterion) et le BIC (ou SBC, Bayesian Information Criterion). Lorsque différents modèles paramétriques sont comparés, le modèle associé à l'AIC ou au BIC le plus faible a la meilleure qualité parmi les modèles comparés.
Lorsque les échantillons peuvent être considérés indépendants, on applique le test de Mann et Whitney pour 2 échantillons, celui de Kruskal et Wallis pour un nombre quelconque d'échantillons. Lorsque on a affaire à deux échantillons appariés (c'est-à-dire non indépendants), on applique le test de Wilcoxon.
Les tests paramétriques, quand leur utilisation est justifiée, sont en général plus puissants que les tests non paramétriques. Les tests paramétriques reposent cependant sur l'hypothèse forte que l'échantillon considéré est tiré d'une population suivant une loi appartenant à une famille donnée.
Les tests non paramétriques sont donc utilisés lorsque le niveau d'échelle n'est pas métrique, que la distribution réelle des variables aléatoires n'est pas connue ou que l'échantillon est simplement trop petit pour supposer une distribution normale.
Mieux vaut choisir un modèle à qui vous pouvez vous identifier et qui doit sa réussite à son travail et à sa détermination. Souvent, les personnes qui ont réussi de manière spectaculaire sont celles qui ont pris de gros risques et qui ont eu de la chance et pas ceux qui ont le plus de talent.
Le test du Chi2 consiste à mesurer l'écart entre une situation observée et une situation théorique et d'en déduire l'existence et l'intensité d'une liaison mathématique. Par exemple, en théorie il y a autant de chance d'obtenir « pile » que « face » au lancer d'une pièce de monnaie, en pratique il n'en est rien.
Lorsque Y et les Xi sont quantitatives, le modèle le plus simple, le plus connu et le plus étudié est nommé régression linéaire, en anglais linear regression. Si Y est qualitative, le modèle est nommé régression logistique, logistic regression en anglais.
Coefficient de corrélation de Pearson
Ce sont des tests statistiques dits robustes car ils ne dépendent pas de la distribution des données. Le test de corrélation de Kendall et celui de Spearman sont recommandés lorsque les variables ne suivent pas une loi normale.
Le test le plus utilisé pour tester la liaison entre une variable quantitative et une variable qualitative à deux (2) modalités est le test de Student (alternative test de Man-Withney).
Si H0 est vraie, alors la kinésithérapie est inefficace, le taux de guérison sera identique dans les 2 groupes. Si H1 est vraie, alors la kinésithérapie est efficace ou délétère, le taux de guérison sera différent entre les 2 groupes.
Les méthodes non paramétriques sont utiles lorsque l'hypothèse de normalité ne tient pas et que l'effectif d'échantillon est faible.
Le test t est utilisé lorsque vous devez trouver la moyenne de la population entre deux groupes, tandis que lorsqu'il y a trois groupes ou plus, vous optez pour le test ANOVA. Le test t et l'ANOVA sont tous deux des méthodes statistiques permettant de tester une hypothèse.
L'analyse de la variance (ANOVA) est très utilisée en statistique et dans le domaine des études marketing. Cette méthode analytique puissante sert à mettre en avant des différences ou des dépendances entre plusieurs groupes statistiques.
Le test de Kruskal-Wallis est un test non paramétrique à utiliser lorsque vous êtes en présence de k échantillons indépendants, afin de déterminer si les échantillons proviennent d'une même population ou si au moins un échantillon provient d'une population différente des autres.
Corrélation entre variables qualitatives
Si vous cherchez à étudier la relation entre deux ou plusieurs variables qualitatives, il faut utiliser le test de Khi-2 d'indépendance. Ce test a le même principe et les mêmes calculs que le test du Khi-2 de comparaison de pourcentages.
Forme de référence la plus simple : la droite La droite exprime une relation entre X et Y du type Y = aX + b. Si la forme du nuage s'apparente à une droite, on parle alors de corrélation linéaire entre les variables. Plus le nuage est étiré et plus la corrélation linéaire observée est forte.
L'intérêt du rôle modèle, c'est qu'il porte un message fort et démontre qu'il est possible de réussir. « Les jeunes ont besoin de quelqu'un qui leur donne envie. La culture et les valeurs d'une entreprise doivent exister par des exemples.
En fait, si les observations sont positionnés sur cette bissectrice, cela signifie que le modèle a généré une valeur égale à la valeur prédite. Si les observations sont en dessous de la ligne, les prédictions sont toujours inférieures aux valeurs réelles (les valeurs prédites sont sous-estimées).
Quel est l'avantage d'utiliser un test paramétrique ? Les tests paramétriques sont, eux, plus puissants en général que leurs équivalents non-paramétriques. Autrement dit, un test paramétrique sera plus apte à aboutir à un rejet de H0, si ce rejet est justifié.
Les tests paramétriques sont des tests dont l'échantillon que nous étudions suit une certaine loi (loi normale par exemple) ou vérifie un certain nombre d'hypothèses (même variance entre les deux échantillons donnés). Ils sont plus puissants mais nécessitent un certain nombre d'hypothèses à vérifier.
Les tests paramétriques sont des tests statistiques qui permettent de mesurer de degré d'association entre une variable quantitative et une variable catégorielle. Rappelons qu'une variable catégorielle est une variable qui différencie les individus en groupes.