1.1 Objectif
Réaliser un test statistique consiste à mettre en œuvre une procédure permettant : de confronter une hypothèse avec la réalité, ou plus exactement, avec ce que l'on perçoit de la réalité à travers les observations à disposition ; de prendre une décision à la suite de cette confrontation.
La construction d'un test d'hypothèse consiste en fait à déterminer entre quelles valeurs peut varier la variable aléatoire, en supposant l'hypothèse vraie, sur la seule considération du hasard de l'échantillonnage.
Pour les données qui suivent une loi normale, nous privilégions toujours les tests paramétriques. C'est à dire le test T de Student et l'ANOVA. Si cette condition n'est pas remplie, nous devons utiliser des tests non paramètriques tel que le test de Wilcoxon, test de Mann Whitney ou un Kruskal Wallis.
Si la statistique-t est supérieure à la valeur critique, alors la différence est significative. Si la statistique-t est inférieure, il n'est pas possible de différencier les deux nombres d'un point de vue statistique.
Un test paramétrique est un test pour lequel on fait une hypothèse paramétrique sur la loi des données sous H0 (loi normale, loi de Poisson...). Les hypothèses du test concernent alors les paramètres de cette loi. Un test non paramétrique est un test ne nécessitant pas d'hypothèse sur la loi des données.
Test unilatéral, ou bilatéral
Lorsque l'hypothèse nulle consiste à tester l'égalité de la valeur du test avec une valeur donnée, le test est bilatéral.
On appelle risque d'erreur de première espèce la probabilité de rejeter H0 et d'accepter H1 alors que H0 est vraie. Ceci se produit si la valeur de la statistique de test tombe dans la région de rejet alors que l'hypothèse H0 est vraie. La probabilité de cet évènement est le niveau de signifiation α.
H0 est opposée à une hypothèse appelée hypothèse alternative, notée H1 ou Ha. Souvent, l'hypothèse alternative est celle à laquelle l'utilisateur souhaite aboutir. Elle implique une notion de différence (différence entre moyennes par exemple). Si les données ne vont pas assez à l'encontre de H0, H0 n'est pas rejetée.
Test de Wilcoxon et test de Mann-Whitney (test non paramétrique de comparaison entre 2 populations indépendantes) Test de Friedman (comparaison de plus de 2 populations appariées) Test de Kruskal-Wallis (comparaison de plus de 2 populations indépendantes)
3.1 Généralités. La statistique a pour objet de recueillir des observations portant sur des sujets présentant une certaine propriété et de traduire ces observations par des nombres qui permettent d'avoir des renseignements sur cette propriété.
Les tests statistiques (ou tests d'hypothèses) vont vous permettre de tirer des conclusions claires, mathématiquement rigoureuses (et élégantes !) à partir des données que vous aurez analysées.
unilatéral à gauche: la valeur de H1 est significativement plus petite que la valeur de H0. bilatéral: la valeur de H1 est significativement différente de la valeur de H0, soit qu'elle est plus grande, soit qu'elle est plus petite.
Par exemple, si vous voulez comparer une moyenne observée à une valeur théorique : Vous souhaitez comparer la moyenne des notes en mathématiques d'une classe à la moyenne du pays ? Dans ce cas nous allons utiliser un test paramétrique car nous pouvons supposer que les données suivent une distribution normale.
Dans un test statistique, la valeur-p (en anglais p-value pour probability value), parfois aussi appelée p-valeur ou probabilité critique, est la probabilité pour un modèle statistique donné sous l'hypothèse nulle d'obtenir une valeur au moins aussi extrême que celle observée.
Une variable statistique est quantitative si ses valeurs sont des nombres sur lesquels des opérations arithmétiques telles que somme, moyenne, ... ont un sens. Caractère statistique (ou variables statistiques) : C'est ce qui est observé ou mesuré sur les individus d'une population statistique.
Niveau de signification
Si la valeur p calculée est inférieure à cette valeur, l'hypothèse nulle est rejetée, sinon elle est maintenue. En règle générale, on choisit un niveau de signification de 5 %. alpha < 0,01 : résultat très significatif. alpha < 0,05 : résultat significatif.
Selon une terminologie classique, ce sont la statistique descriptive et la statistique mathématique.
Contentez vous de les décrire. Les raisons pour lesquelles des résultats particuliers sont observés (ou non) sont l'objet de la partie discussion. – Lorsque vous mentionnez vos variables dans le texte, ou qu'elles sont écrites dans vos tableaux ou figures, utilisez des termes français transparents et non pas des codes.