Une variable catégorique (aussi appelée variable qualitative) réfère à une caractéristique qui n'est pas quantifiable. Une variable catégorique peut être nominale ou ordinale.
Une variable qualitative est dite ordinale si ses valeurs peuvent être ordonnées, c'est-à-dire classées sans ambiguïté de la plus petite à la plus grande, par exemple des qualificatifs comme « souvent » ou « parfois », ou des mentions comme « bien » et « très bien »).
Deux variables quantitatives sont corrélées si elles tendent à varier l'une en fonction de l'autre. On parle de corrélation positive si elles tendent à varier dans le même sens, de corrélation négative si elles tendent à varier en sens contraire.
Exemple : l'âge est théoriquement une variable quantitative continue, mais en pratique l'âge est mesuré dans le meilleur des cas au jours près.
Les variables indépendantes sont celles qui sont manipulées, tandis que les variables dépendantes sont seulement mesurées ou enregistrées.
La description d'une variable qualitative est beaucoup plus sommaire. Une fois les modalités de la variable identifiées, il s'agit d'identifier le mode et d'étudier les proportions associées à chaque modalité. Il sera souvent plus intéressant de croiser des variables qualitatives afin d'extraire plus d'information.
Caractère qualitatif : Une variable statistique est qualitative si ses valeurs, ou modalités, s'expriment de façon littérale ou par un codage sur lequel les opérations arithmétiques telles que moyenne, somme, ... , n'ont pas de sens.
Les études qualitatives permettent également d'apprécier la perception de « l'image d'une marque » (ancrage, champ de compétence, personnalité, combat, valeurs, etc.). Les études qualitatives servent à comprendre les ressorts du comportement du consommateur, elles permettent un décryptage des insights.
Les variables quantitatives continues correspondent à des données issues de mesures, comme par exemple la taille, le poids, la pression artérielle, la glycémie, etc.
5.3.2 Quantitatif à qualitatif
Si une variable numérique contient en réalité un petit nombre de valeurs différentes, il suffit de convertir la classe de l'objet de numeric vers factor ou ordered pour que R comprenne que la variable doit être traitée comme une variable qualitative.
On récapitule ! Variables qualitatives ou catégorielles expriment une qualité comme le sexe, le métier ou le nom. Nominales, comme par exemple le nom des journaux, le signe astrologique. Ordinales, désigne le rang : un peu, moyen, beaucoup, énormément, à la folie !
Selon une terminologie classique, ce sont la statistique descriptive et la statistique mathématique.
Une variable quantitative peut être discrète (si ses valeurs sont des nombres entiers, comme le nombre d'enfants) ou continue (si la variable peut prendre toutes les valeurs d'un intervalle, comme le taux de glycémie).
pour tester le type d'une variable, on peut faire : type(var) == list (ou str ou int ou float) mais pour tester le type d'une variable, le mieux est isinstance(var, list). isinstance donne True si on teste si un objet contre sa classe, mais aussi contre ses classes de base.
On appelle caractère quantitatif un caractère mesurable dont la variation est continue. Ce caractère peut donc prendre une infinité de valeurs possibles (par exemple le poids, la longueur...).
Un caractère peut être qualitatif (non mesurable) ou quantitatif (mesurable). Un caractère quantitatif est discret s'il prend un nombre fini de valeurs ou continu, s'il prend toutes les valeurs entre deux limites.
Quand la réponse donnée est un mot ou une expression (la langue maternelle, le sexe, la couleur des yeux, etc.). Quand la réponse donnée est un nombre. Selon la nature de ce nombre, cette variable sera discrète ou continue.
Il est possible de regrouper les données relatives à deux variables qualitatives sous la forme d'un tableau d'effectifs ou de fréquences. On parle de tableau de contingence. La réalisation d'un tableau de contingence sur R se fait à l'aide de la commande table() .
Avec R, la fonction median() permet d'obtenir la médiane d'une variable quantitative. Si le nombre de valeurs n est impair (n=2k+1 n = 2 k + 1 ), c'est la valeur exacte observée au rang k+1 . Si le nombre de valeurs est pair(n=2k n = 2 k ), c'est la moyenne entre les valeurs observées aux rangs k et k+1 .
Par conséquent, les corrélations sont généralement exprimées à l'aide de deux chiffres clés : r = et p = . Plus r est proche de zéro, plus la relation linéaire est faible. Les valeurs positives de r indiquent une corrélation positive lorsque les valeurs des deux variables tendent à augmenter ensemble.
Les variables doivent correspondre exactement à la problématique et se reporter à l'objet et son unité d'échantillonnage. Un ensemble de variables sera complet et pertinent si l'information apportée permet de décrire toutes les situations possibles pour répondre à l'objectif.
Qui peut varier. Synonyme : capricieux, changeant, flottant, fluctuant, incertain, instable, irrégulier, mobile, papillonnant. – Littéraire : inconstant, ondoyant.
Que signifie Variable explicative ? On parle d'une variable explicative lorsque la variable explique la variable expliquée, la variable expliquée étant une variable qu'une théorie cherche à expliquer. Les économistes évaluent la capacité de la variable explicative à expliquer une situation.