Une variable qualitative est une variable dont les valeurs sont des caractéristiques ou des catégories. Ces valeurs sont exprimées à l'aide de noms plus ou moins significatifs (par exemple, essai 1, essai 2, essai 3, ...) ou de codes (par exemple, les lettres A, B, C).
On différencie deux types de variables : les variables quantitatives : il s'agit de valeurs numériques, on les appelles aussi continues, les variables qualitatives : il s'agit de variables dont le nombre de valeurs possibles est limité. Ces valeurs sont appelées modalités.
Une variable catégorique (aussi appelée variable qualitative) réfère à une caractéristique qui n'est pas quantifiable. Une variable catégorique peut être nominale ou ordinale.
En algèbre, on tente de généraliser les calculs en remplaçant très souvent les nombres par des lettres. Ces lettres se nomment des variables. Une variable peut être représentée par n'importe quelle lettre de l'alphabet. Dans ces expressions algébriques, les lettres a, b, c, y et z sont des variables.
Une variable statistique est quantitative si ses valeurs sont des nombres sur lesquels des opérations arithmétiques telles que somme, moyenne, ... ont un sens. Caractère statistique (ou variables statistiques) : C'est ce qui est observé ou mesuré sur les individus d'une population statistique.
Exemple : l'âge est théoriquement une variable quantitative continue, mais en pratique l'âge est mesuré dans le meilleur des cas au jours près.
5.3.2 Quantitatif à qualitatif
Si une variable numérique contient en réalité un petit nombre de valeurs différentes, il suffit de convertir la classe de l'objet de numeric vers factor ou ordered pour que R comprenne que la variable doit être traitée comme une variable qualitative.
Les variables qualitatives les plus simples sont les variables qualitatives binaires (ou dichotomiques) qui ne comptent que deux modalités ; c'est le cas par exemple pour le sexe, ou pour le codage de la plupart des états pathologiques (présence ou absence de la maladie).
Une variable dans le domaine de la recherche est un objet, une idée ou toute autre caractéristique qui peut prendre n'importe quelle valeur que vous essayez de mesurer.
La représentation graphique de la distribution des probabilités d'une variable qualitative fait appel à 2 types de graphique communément désigné sous les termes : diagramme en bâton et le diagramme circulaire.
La comparaison de deux variables qualitatives s'appelle en général un tableau croisé . C'est sans doute l'une des analyses les plus fréquentes lors du traitement d'enquêtes en sciences sociales.
Il s'agit du test de Kruskal-Wallis, mesure de l'association entre deux variables qualitatives.
Le test le plus utilisé pour tester la liaison entre une variable quantitative et une variable qualitative à deux (2) modalités est le test de Student (alternative test de Man-Withney).
Deux variables quantitatives sont corrélées si elles tendent à varier l'une en fonction de l'autre. On parle de corrélation positive si elles tendent à varier dans le même sens, de corrélation négative si elles tendent à varier en sens contraire.
En plaçant chaque élément dans ce système de coordonnées, on obtient un nuage de points (lorsque les deux variables sont quantitatives). Dans un diagramme en secteur (appelé de façon familière «camembert»), les effectifs des différentes classes sont représentés par des secteurs d'angles proportionnels aux effectifs.
La principale différence entre les variables nominales et les variables ordinales est que les variables ordinales ont un ordre de catégories alors que les variables nominales n'en ont pas.
Pour faire simple, les données quantitatives fournissent les chiffres qui valident les points généraux de votre étude alors que les données qualitatives apportent les détails et le contexte pour en comprendre toutes les implications.
On appelle caractère quantitatif un caractère mesurable dont la variation est continue. Ce caractère peut donc prendre une infinité de valeurs possibles (par exemple le poids, la longueur...).
Variables qualitatives ou catégorielles expriment une qualité comme le sexe, le métier ou le nom.
Or selon la théorie il faut faire un test de Fisher lorsque la présence de racine unitaire n'est pas rejetée (p. value > 5%). Dans le cas contraire, le test convenable est en principe celui de student pour tester uniquement la significativité de la tendance ou de la constante.
Il est possible de regrouper les données relatives à deux variables qualitatives sous la forme d'un tableau d'effectifs ou de fréquences. On parle de tableau de contingence. La réalisation d'un tableau de contingence sur R se fait à l'aide de la commande table() .
L'interprétation adéquate des données qualitatives nécessite donc une profonde immersion, ainsi que le déroulement d'un processus réitéré de collecte, d'analyse, d'interprétation et d'écriture dans lequel le chercheur développera un système analytique permettant de donner du sens aux données (Morrow, 2005).
ANOVA permet de déterminer si la différence entre les valeurs moyennes est statistiquement significative. ANOVA révèle aussi indirectement si une variable indépendante influence la variable dépendante.
Pour étudier le relation entre une variable qualitative et une variable quantita- tive, on décompose la variation totale en variation intergroupe et en variation intragroupe. Pour mesurer l'intensité de la relation (toujours d'un point de vue descriptif), on peut calculer un param`etre appelé rapport de corrélation.
Le coefficient de Pearson permet de mesurer le niveau de corrélation entre les deux variables. Il renvoie une valeur entre -1 et 1. S'il est proche de 1 cela signifie que les variables sont corrélées, proche de 0 que les variables sont décorrélées et proche de -1 qu'elles sont corrélées négativement.