Un test de Student peut être utilisé pour évaluer si un seul groupe diffère d'une valeur connue (test t à un échantillon), si deux groupes diffèrent l'un de l'autre (test t à deux échantillons indépendants), ou s'il existe une différence significative dans des mesures appariées (test de Student apparié ou à ...
Si la statistique-t est supérieure à la valeur critique, alors la différence est significative. Si la statistique-t est inférieure, il n'est pas possible de différencier les deux nombres d'un point de vue statistique.
La procédure de l'analyse du test t apparié est la suivante: Calculer la différence (d) entre chaque paire de valeur. Calculer la moyenne (m) et l'écart-type (s) de d. Comparer la différence moyenne à 0.
L'hypothèse selon laquelle on fixe à priori un paramètre de la population à une valeur particulière s'appelle l'hypothèse nulle et est notée H0. N'importe quelle autre hypothèse qui diffère de l'hypothèse H0 s'appelle l'hypothèse alternative (ou contre-hypothèse) et est notée H1.
On appelle risque alpha le risque de conclure à l'existence d'une différence qui n'existe pas en réalité: en thérapeutique, cela revient à considérer efficace un traitement qui ne l'est pas.
Lorsque les données sont collectées, la valeur-p est calculée et la décision suivante est prise : si elle est inférieure à α, on rejette l'hypothèse nulle au profit de l'hypothèse alternative ; si elle est supérieure à α, on rejette l'hypothèse alternative au profit de l'hypothèse nulle.
Le test de Student permet de comparer deux moyennes d'échantillons afin de voir si ceux-ci sont vraisemblablement issues de la même population (hypothèse nulle H0) ou, au contraire, significativement différentes. Plus simplement : ce test donne la probabilité qu'une différence observée soit due au hasard.
La valeur t mesure l'ampleur de la différence par rapport à la variation de vos données d'échantillon. En d'autres termes, T est simplement la différence calculée représentée dans les unités de l'erreur type de la moyenne. Plus l'ampleur de T est grande, plus la preuve contre l'hypothèse nulle est grande.
Deux échantillons E1 et E2 sont dit appariés lorsque chaque valeur x1,i de E1 est associée à une valeur x2,i de E2 (appariés = associés par paire : variables dépendantes). Par exemple E1 peut être un groupe de malades avant traitement et E2 le groupe des mêmes malades après traitement.
Elle est notamment utilisée pour les tests de Student, la construction d'intervalle de confiance et en inférence bayésienne.
A.
Le test statistique est utile lorsqu'il faut trancher entre 2 hypothèses : H0 : hypothèse nulle, elle correspond à une situation de statu quo. H1 : hypothèse alternative, elle correspond à l'hypothèse qu'on veut démontrer.
Le test statistique se base sur le coefficient de Pearson r calculé par cor(x, y) . Il suit une distribution t avec un degré de liberté ddl = length(x)-2 si les échantillons suivent une distribution normale indépendante. La fonction indique enfin une p-value pour ce test.
Deux tests statistiques, le test de Student et le test de Wilcoxon, sont généralement employés pour comparer deux moyennes. Il existe cependant des variantes de ces deux tests, pour répondre à différentes situations, comme la non indépendance des échantillons par exemple.
Le cas de deux échantillons appariés :
On forme pour chaque paire d'observations la différence puis on classe ces observations en valeurs absolues croissantes, en mentionnant pour chacune si elle est positive ou négative (les différences nulles sont éliminées).
(+) Le résultat est POSITIF si deux bandes colorées apparaissent au niveau des zones (C) et (T). (-) Le résultat du test est NÉGATIF si une bande colorée apparait uniquement dans la zone contrôle (C). (X) Si la ligne contrôle (C) n'apparait pas, le résultat est INVALIDE. Il faut refaire un autotest.
Le temps est égal à la distance divisée par la vitesse.
Un test est dit statistiquement significatif lorsque le risque quantifié de se tromper, nommé p-valeur, est inférieur à un niveau de signification alpha. Pour être plus précis, la valeur-p est la probabilité d'obtenir une donnée aussi extrême sous l'hypothèse nulle.
Les méthodes non paramétriques sont utiles lorsque l'hypothèse de normalité ne tient pas et que l'effectif d'échantillon est faible. Cela dit, dans les tests non paramétriques, vos données reposent également sur des hypothèses.
La valeur critique se trouve sur le croisement d'une colonne, correspondante à la probabilité donnée, et d'une ligne, correspondant aux degrés de liberté. Par exemple, la valeur critique de χ² avec 4 degrés de liberté pour la probabilité 0.25 est égale 5.38527.
Les tests paramétriques
s'utilisent lorsque les données sont 'distribuées', donc elles suivent la forme d'une courbe. Par exemple, lorsque la distribution des données est normale.
S'il génère une valeur p inférieure ou égale au niveau de signification, le résultat est considéré comme statistiquement significatif (et permet de rejeter l'hypothèse nulle). Cela est généralement écrit sous la forme suivante : p≤0,05.
Une valeur-p de 0,05 signifie qu'il y a une chance sur 20 qu'une hypothèse correcte soit rejetée plusieurs fois lors d'une multitude de tests (et n'indique pas, comme on le croit souvent, que la probabilité d'erreur sur un test unique est de 5 %).
Faire le test dans un logiciel de statistiques généraliste vous permet de le voir directement (on peut demander le détail du khi-deux par case du tableau) ; avec biostatgv, il faut passer par un recodage, ce qui est de toute façon intéressant en soi.