Un test statistique vérifie une hypothèse formulée sur les paramètres descriptifs (moyennes, pourcentages, variances, …) des séries à comparer. Il vise en réalité à savoir si la différence observée entre les paramètres calculés dans l'échantillon (moyennes ou pourcentages) existe réellement dans la population.
Dans la première partie, nous avons discuté de l'importance des tests statistiques. Pourquoi faire des tests statistiques ? Parce qu'ils vous indiquent si la disparité des résultats d'une expérience est purement due au hasard, ou si elle révèle une différence significative entre les individus étudiés.
Les tests statistiques permettent de contrôler la validité d'une hypothèse émise sur une population-mère, à partir des observations effectuées sur un échantillon. L'hypothèse ainsi énoncée est appelée hypothèse nulle ou H0.
Il nous permet de comparer des populations infinies de réplicats, quelque chose qui sera, évidemment, toujours inaccessible à l'expérience ; il nous permet de raisonner sur une expérience parfaite (celle qui aurait une infinité de réplicats, aussi bien pour le sauvage, que pour le mutant), sans avoir à la réaliser.
Si la statistique-t est supérieure à la valeur critique, alors la différence est significative. Si la statistique-t est inférieure, il n'est pas possible de différencier les deux nombres d'un point de vue statistique.
La science des statistiques est utile pour choisir objectivement un échantillon, faire des généralisations valables à partir des observations faites sur l'ensemble d'échantillons, mais aussi pour mesurer le degré d'incertitude, ou la fiabilité, des conclusions tirées.
Pour les données qui suivent une loi normale, nous privilégions toujours les tests paramétriques. C'est à dire le test T de Student et l'ANOVA. Si cette condition n'est pas remplie, nous devons utiliser des tests non paramètriques tel que le test de Wilcoxon, test de Mann Whitney ou un Kruskal Wallis.
La formulation des hypothèses, le choix du test statistique et l'analyse des résultats sont les étapes les plus importantes.
principal est de préciser un phénomène sur une population globale, à partir de son observation sur une partie restreinte de cette population, l'échantillon. Il s'agit donc d'induire (ou encore d'inférer) du particu- lier au général avec un objectif principalement explicatif.
Test de Wilcoxon et test de Mann-Whitney (test non paramétrique de comparaison entre 2 populations indépendantes) Test de Friedman (comparaison de plus de 2 populations appariées) Test de Kruskal-Wallis (comparaison de plus de 2 populations indépendantes)
Une hypothèse statistique est un énoncé (une affirmation) concernant les caractéristiques (valeurs des paramètres, forme de la distribution des observations) d'une population.
Le test le plus utilisé pour tester la liaison entre une variable quantitative et une variable qualitative à deux (2) modalités est le test de Student (alternative test de Man-Withney).
Les données peuvent être divisées en 2 grandes catégories. Catégoriques et quantitatives. Les données catégories peuvent être subdivisées en données nominales et ordinales. Les données quantitatives peuvent être discrète ou continue et sont aussi appelées données numériques.
Le test t est utilisé lorsque vous devez trouver la moyenne de la population entre deux groupes, tandis que lorsqu'il y a trois groupes ou plus, vous optez pour le test ANOVA. Le test t et l'ANOVA sont tous deux des méthodes statistiques permettant de tester une hypothèse.
La statistique est une méthode mathématique, avec collecte et description de données, qui permet l'analyse et l'inférence de conclusions à partir des données quantitatives. Les statistiques sont une introduction à la valeur attendue, la variance, l'écart type, la covariance, la corrélation et l'interpolation.
La statistique est la science qui consiste à réunir des données chiffrées, à les analyser et à les commenter. Une étude statistique s'effectue sur un ensemble appelé population dont les éléments sont appelés individus et consiste à observer et étudier un même aspect sur chaque individu, appelé caractère.
Niveau de signification
Si la valeur p calculée est inférieure à cette valeur, l'hypothèse nulle est rejetée, sinon elle est maintenue. En règle générale, on choisit un niveau de signification de 5 %. alpha < 0,01 : résultat très significatif. alpha < 0,05 : résultat significatif.
Le test de Shapiro-Wilk est le plus utilisé pour évaluer la distribution Normale d'un échantillon. Il est adapté aussi bien aux petits qu'aux grands échantillons. Ce test réalisable sur un logiciel de statistique donne directement la p-value.