Deux variables quantitatives sont corrélées si elles tendent à varier l'une en fonction de l'autre. On parle de corrélation positive si elles tendent à varier dans le même sens, de corrélation négative si elles tendent à varier en sens contraire.
Une variable numérique (aussi appelée variable quantitative) est une caractéristique quantifiable dont les valeurs sont des nombres, à l'exclusion des nombres qui correspondent en fait à des codes. Les variables numériques peuvent être continues ou discrètes.
Un caractère quantitatif est discret s'il prend un nombre fini de valeurs ou continu, s'il prend toutes les valeurs entre deux limites.
Croiser une variable quantitative et une variable qualitative, c'est essayer de voir si les valeurs de la variable quantitative se répartissent différemment selon la catégorie d'appartenance de la variable qualitative. Cette syntaxe de boxplot utilise une nouvelle notation de type “formule”.
Une variable quantitative est une variable dont les valeurs sont exprimées par des nombres, accompagnés au besoin d'unités et d'incertitudes. Une variable quantitative est dite discrète si elle ne peut prendre que des valeurs bien précises (des entiers, par exemple, comme celles qui résultent d'un dénombrement).
Il existe deux types de variables qualitatives : les variables qualitatives ordinales et les variables qualitatives nominales.
Une variable discrète a une valeur finie. Il est possible de les énumérer ( » 1, 2, 3,… »). Une variable continue peut prendre, en théorie, une infinité des valeurs, formant un ensemble continu.
La comparaison de deux variables quantitatives se fait en premier lieu graphiquement, en représentant l'ensemble des couples de valeurs. On peut ainsi représenter les valeurs du nombre d'heures passées devant la télévision selon l'âge. Le fait que des points sont superposés ne facilite pas la lecture du graphique.
Les variables quantitatives continues correspondent à des données issues de mesures, comme par exemple la taille, le poids, la pression artérielle, la glycémie, etc.
La meilleure façon d'identifier les variables dépendantes et indépendantes dans la recherche est de mettre les variables dans la phrase« Les variables indépendantes provoquent un changement dans la variable dépendante ».”.
Exemple : l'âge est théoriquement une variable quantitative continue, mais en pratique l'âge est mesuré dans le meilleur des cas au jours près.
La description d'une variable qualitative consiste à présenter les effectifs, c'est-à-dire le nombre d'individus de l'échantillon pour chaque modalité de la variable, et les fré- quences, c'est-à-dire la proportion des réponses associées à chaque modalité de la variable étudiée.
Caractère qualitatif : Une variable statistique est qualitative si ses valeurs, ou modalités, s'expriment de façon littérale ou par un codage sur lequel les opérations arithmétiques telles que moyenne, somme, ... , n'ont pas de sens.
Lorsque le caractère statistique est un nombre (taille, note, nombre d'enfant…) on parle de caractère quantitatif, quand ce caractère n'est pas chiffré (langue parlée, secteur d'activité, couleur...) on parle de caractère qualitatif (soit nominal, soit ordinal).
Caractère quantitatif discret
Quand la réponse donnée est un nombre naturel (nombre d'enfants dans une famille, nombre d'amis, nombre de maisons, etc.). Quand la réponse donnée peut prendre n'importe quelle valeur dans un intervalle donné (la taille d'une personne, le temps, etc.).
Les données discrètes, contrairement aux données continues, sont comptables. Elles ne peuvent être constituées que de nombres entiers. Par exemple, le nombre d'enfants dans une famille ou l'âge (arrondi) d'une personne sont des données discrètes.
Pour faire simple, les données quantitatives fournissent les chiffres qui valident les points généraux de votre étude alors que les données qualitatives apportent les détails et le contexte pour en comprendre toutes les implications.
Il est possible de regrouper les données relatives à deux variables qualitatives sous la forme d'un tableau d'effectifs ou de fréquences. On parle de tableau de contingence. La réalisation d'un tableau de contingence sur R se fait à l'aide de la commande table() .
5.3.2 Quantitatif à qualitatif
Si une variable numérique contient en réalité un petit nombre de valeurs différentes, il suffit de convertir la classe de l'objet de numeric vers factor ou ordered pour que R comprenne que la variable doit être traitée comme une variable qualitative.
Le diagramme en bâtons est utilisé dans le cas d'une variable quantitative discrète (figure 4). Il repose sur le même principe que l'histogramme mais les rectangles sont remplacés par des segments (bâtons). Le principal avantage de ce diagramme est qu'il traduit le caractère « isolé » des valeurs.