La qualité d'un modèle peut se traduire par un compromis entre une bonne adéquation du modèle aux données et un nombre minimal de paramètres. Cette qualité peut se mesurer grâce à des indices. Les plus populaires sont l'AIC (Akaike's Information Criterion) et le BIC (ou SBC, Bayesian Information Criterion).
Le test t est utilisé lorsque vous devez trouver la moyenne de la population entre deux groupes, tandis que lorsqu'il y a trois groupes ou plus, vous optez pour le test ANOVA. Le test t et l'ANOVA sont tous deux des méthodes statistiques permettant de tester une hypothèse.
Cela s'articule habituellement autour de l'hypothèse nulle (H0): si on accepte l'hypothèse nulle, l'hypothèse alternative (H1) est infirmée; inversement, si on rejette l'hypothèse nulle, l'hypothèse alternative est confirmée.
En résumé, si la puissance statistique est assez importante (supérieure à 0.95 par exemple), on peut accepter H0 avec un risque proportionnel à (1 – puissance) d'avoir tort. Ce risque est appelé le risque Bêta.
Un test de Student peut être utilisé pour évaluer si un seul groupe diffère d'une valeur connue (test t à un échantillon), si deux groupes diffèrent l'un de l'autre (test t à deux échantillons indépendants), ou s'il existe une différence significative dans des mesures appariées (test de Student apparié ou à ...
Quand pouvez-vous utiliser un test T ? Un test T peut être utilisé lorsque vous souhaitez comparer les moyennes entre deux groupes. Cela ne fonctionne pas lorsqu'il y a plus de deux groupes. Dans de tels cas, vous devez utiliser ANOVA ou des tests post-hoc.
Duncan en 1955. Ce test post-hoc ou test de comparaisons multiples peut être utilisé pour déterminer les différences significatives entre les moyennes des groupes dans une analyse de variance.
Le test le plus utilisé pour tester la liaison entre une variable quantitative et une variable qualitative à deux (2) modalités est le test de Student (alternative test de Man-Withney).
Définitions. Un test paramétrique est un test pour lequel on fait une hypothèse paramétrique sur la loi des données sous H0 (loi normale, loi de Poisson...); Les hypothèses du test concernent alors les paramètres de cette loi. Un test non paramétrique est un test ne nécessitant pas d'hypothèse sur la loi des données.
Mieux vaut choisir un modèle à qui vous pouvez vous identifier et qui doit sa réussite à son travail et à sa détermination. Souvent, les personnes qui ont réussi de manière spectaculaire sont celles qui ont pris de gros risques et qui ont eu de la chance et pas ceux qui ont le plus de talent.
Lorsque Y et les Xi sont quantitatives, le modèle le plus simple, le plus connu et le plus étudié est nommé régression linéaire, en anglais linear regression. Si Y est qualitative, le modèle est nommé régression logistique, logistic regression en anglais.
Le test U de Mann-Whitney est donc le pendant non paramétrique du test t pour échantillons indépendants ; il est soumis à des hypothèses moins strictes que le test t. Par conséquent, le test U de Mann-Whitney est toujours utilisé lorsque la condition de distribution normale du test t n'est pas remplie.
Si la statistique-t est supérieure à la valeur critique, alors la différence est significative. Si la statistique-t est inférieure, il n'est pas possible de différencier les deux nombres d'un point de vue statistique.
En statistiques, les tests de normalité permettent de vérifier si des données réelles suivent une loi normale ou non. Les tests de normalité sont des cas particuliers des tests d'adéquation (ou tests d'ajustement, tests permettant de comparer des distributions), appliqués à une loi normale.
Pour comparer deux moyennes, il faut habituellement employer le test «T» de Student, qui suppose la normalité des distributions et l'égalité des variances (test paramétrique), hypothèses invérifiables avec des effectifs faibles.
Un test non paramétrique est un test d'hypothèse qui n'exige pas que la distribution de la population soit caractérisée par certains paramètres. Par exemple, de nombreux tests d'hypothèse supposent que la population obéit à une loi normale pour les paramètres µ et σ.
La p-value, correspondant à la valeur absolue des statistiques du test t (|t|), est calculée pour les degrés de liberté (df): df = n - 1 .
Comment formuler une hypothèse ? Pour formuler une hypothèse, il faut d'abord définir une question de recherche. Une hypothèse formulée avec précision sur la population peut ensuite être dérivée de la question de recherche, par exemple : les hommes gagnent plus que les femmes pour un même emploi en Autriche.
Une hypothèse statistique est un énoncé (une affirmation) concernant les caractéristiques (valeurs des paramètres, forme de la distribution des observations) d'une population.