La description d'une variable qualitative consiste à présenter les effectifs, c'est-à-dire le nombre d'individus de l'échantillon pour chaque modalité de la variable, et les fré- quences, c'est-à-dire la proportion des réponses associées à chaque modalité de la variable étudiée.
Le rapport de corrélation est un indicateur statistique qui mesure l'intensité de la liaison entre une variable quantitative et une variable qualitative. la moyenne globale. Si le rapport est proche de 0, les deux variables ne sont pas liées. Si le rapport est proche de 1, les variables sont liées.
Le test du Chi2 consiste à mesurer l'écart entre une situation observée et une situation théorique et d'en déduire l'existence et l'intensité d'une liaison mathématique. Par exemple, en théorie il y a autant de chance d'obtenir « pile » que « face » au lancer d'une pièce de monnaie, en pratique il n'en est rien.
Ainsi, une variable peut être qualitative ou quantitative; une variable qualitative peut être nominale ou ordinale, alors qu'une variable quantitative peut être continue ou discrète.
Afin d'étudier la dépendance (ou l'indépendance) de deux variables qualitatives, une première étape peut être d'établir un tableau de contingence et d'en représenter le contenu à l'aide de graphiques adaptés (un diagramme en barres par exemple).
L'analyse d'une variable commence par son tri à plat qui est en fait le tableau de la distribution de ses données triées selon ses différentes valeurs : cela consiste tout simplement à dénombrer les résultats obtenus.
Le test t est utilisé lorsque vous devez trouver la moyenne de la population entre deux groupes, tandis que lorsqu'il y a trois groupes ou plus, vous optez pour le test ANOVA. Le test t et l'ANOVA sont tous deux des méthodes statistiques permettant de tester une hypothèse.
Il existe un autre test non paramétrique permettant de comparer plus de 2 échantillons et qui est en fait la généralisation du test de Mann-Whitney. Il s'agit du test de Kruskal-Wallis, mesure de l'association entre deux variables qualitatives.
On distingue ainsi classiquement trois types de caractères observables, ou encore de variables : les variables nominales, les variables ordinales et les variables métriques.
Les courbes de fréquence
Les données issues de séries statistiques doubles avec une variable qualitative, l'autre quantitative, sont représentées graphiquement par une série de courbes de fréquence ou d'histogrammes (voir aussi page 78).
Pour les données qui suivent une loi normale, nous privilégions toujours les tests paramétriques. C'est à dire le test T de Student et l'ANOVA. Si cette condition n'est pas remplie, nous devons utiliser des tests non paramètriques tel que le test de Wilcoxon, test de Mann Whitney ou un Kruskal Wallis.
Le coefficient de Pearson permet de mesurer le niveau de corrélation entre les deux variables. Il renvoie une valeur entre -1 et 1. S'il est proche de 1 cela signifie que les variables sont corrélées, proche de 0 que les variables sont décorrélées et proche de -1 qu'elles sont corrélées négativement.
Le nuage de points est un outil graphique qui permet de mettre en exergue la relation entre deux variables quantitatives. Généralement, la variable en abscisse représente la variable de cause et la variable en ordonnée représente la variable de réponse.
L'analyse bivariée permet d'étudier la relation entre deux variables. Il est utile de déterminer s'il existe une corrélation entre les variables et, dans l'affirmative, quel est le degré de cette corrélation. Pour les chercheurs qui mènent une étude, c'est une aide précieuse.
La description d'une variable quantitative se base sur les statistiques suivantes : la moyenne, la médiane, la variance, l'écart-type, les quantiles. On peut aller plus loin en regardant l'asymétrie et l'aplatissement.
La comparaison de deux variables quantitatives se fait en premier lieu graphiquement, en représentant l'ensemble des couples de valeurs. On peut ainsi représenter les valeurs du nombre d'heures passées devant la télévision selon l'âge. Le fait que des points sont superposés ne facilite pas la lecture du graphique.
La corrélation est une mesure statistique qui exprime la notion de liaison linéaire entre deux variables (ce qui veut dire qu'elles évoluent ensemble à une vitesse constante). C'est un outil courant permettant de décrire des relations simples sans s'occuper de la cause et de l'effet.
Définitions. Un test paramétrique est un test pour lequel on fait une hypothèse paramétrique sur la loi des données sous H0 (loi normale, loi de Poisson...); Les hypothèses du test concernent alors les paramètres de cette loi. Un test non paramétrique est un test ne nécessitant pas d'hypothèse sur la loi des données.
Les expériences nécessitent deux principaux types de variables, à savoir la variable indépendante et la variable dépendante. La variable indépendante est la variable qui est manipulée et qui est supposée avoir un effet direct sur la variable dépendante, la variable étant mesurée et testée.
On récapitule ! Variables qualitatives ou catégorielles expriment une qualité comme le sexe, le métier ou le nom. Nominales, comme par exemple le nom des journaux, le signe astrologique. Ordinales, désigne le rang : un peu, moyen, beaucoup, énormément, à la folie !
À quelques exceptions près, il n'est pas possible de transformer une variable qualitative en variable quantitative. En revanche, il est possible de transformer une variable quantitative en variable qualitative, en la divisant en tranches notamment.
L'ANOVA univariée est généralement utilisée lorsque l'on a une seule variable indépendante, ou facteur, et que l'objectif est de vérifier si des variations, ou des niveaux différents de ce facteur ont un effet mesurable sur une variable dépendante.
Un test de Student peut être utilisé pour évaluer si un seul groupe diffère d'une valeur connue (test t à un échantillon), si deux groupes diffèrent l'un de l'autre (test t à deux échantillons indépendants), ou s'il existe une différence significative dans des mesures appariées (test de Student apparié ou à ...
Duncan en 1955. Ce test post-hoc ou test de comparaisons multiples peut être utilisé pour déterminer les différences significatives entre les moyennes des groupes dans une analyse de variance.