Deux variables quantitatives sont corrélées si elles tendent à varier l'une en fonction de l'autre. On parle de corrélation positive si elles tendent à varier dans le même sens, de corrélation négative si elles tendent à varier en sens contraire.
Les variables peuvent être classées en deux catégories principales : les catégoriques et les variables numériques. Chacune des catégories se sépare en deux sous-catégories : nominale et ordinales pour les variables catégoriques, discrètes et continues pour les variables numériques.
Un caractère quantitatif est discret s'il prend un nombre fini de valeurs ou continu, s'il prend toutes les valeurs entre deux limites.
C'est ce qui est observé ou mesuré sur les individus d'une population statistique. Il peut s'agir d'une variable qualitative ou quantitative. Exemples : Taille, poids, salaire, sexe, profession d'un groupe donné d'individus.
Les variables quantitatives
Une variable continue est une variable qui peut prendre toutes les valeurs possibles d'un intervalle de nombres réels.
Une variable quantitative est une variable dont les valeurs sont exprimées par des nombres, accompagnés au besoin d'unités et d'incertitudes. Une variable quantitative est dite discrète si elle ne peut prendre que des valeurs bien précises (des entiers, par exemple, comme celles qui résultent d'un dénombrement).
Exemple : l'âge est théoriquement une variable quantitative continue, mais en pratique l'âge est mesuré dans le meilleur des cas au jours près.
On distingue ainsi classiquement trois types de caractères observables, ou encore de variables : les variables nominales, les variables ordinales et les variables métriques.
On différencie deux types de variables : les variables quantitatives : il s'agit de valeurs numériques, on les appelles aussi continues, les variables qualitatives : il s'agit de variables dont le nombre de valeurs possibles est limité. Ces valeurs sont appelées modalités.
En recherche, on distingue deux variables : la variable indépendante et la variable dépendante. Elle est celle qui est manipulé par le chercheur. C'est la cause dans la relation de cause à effet. Elle est censée avoir une influence sur une autre dite dépendante.
Une variable discrète a une valeur finie. Il est possible de les énumérer ( » 1, 2, 3,… »). Une variable continue peut prendre, en théorie, une infinité des valeurs, formant un ensemble continu.
La comparaison de deux variables quantitatives se fait en premier lieu graphiquement, en représentant l'ensemble des couples de valeurs. On peut ainsi représenter les valeurs du nombre d'heures passées devant la télévision selon l'âge. Le fait que des points sont superposés ne facilite pas la lecture du graphique.
Croiser une variable quantitative et une variable qualitative, c'est essayer de voir si les valeurs de la variable quantitative se répartissent différemment selon la catégorie d'appartenance de la variable qualitative. Cette syntaxe de boxplot utilise une nouvelle notation de type “formule”.
En plaçant chaque élément dans ce système de coordonnées, on obtient un nuage de points (lorsque les deux variables sont quantitatives). Dans un diagramme en secteur (appelé de façon familière «camembert»), les effectifs des différentes classes sont représentés par des secteurs d'angles proportionnels aux effectifs.
Pour faire simple, les données quantitatives fournissent les chiffres qui valident les points généraux de votre étude alors que les données qualitatives apportent les détails et le contexte pour en comprendre toutes les implications.
Une étude quantitative est une analyse qui mesure les comportements ou opinions des consommateurs (grand-public, décideurs dans les entreprises, internautes...). Les études quantitatives sont utilisées par les industries, les commerçants, les institutions (voire les associations) dans un but précis.
5.3.2 Quantitatif à qualitatif
Si une variable numérique contient en réalité un petit nombre de valeurs différentes, il suffit de convertir la classe de l'objet de numeric vers factor ou ordered pour que R comprenne que la variable doit être traitée comme une variable qualitative.
Les variables qualitatives les plus simples sont les variables qualitatives binaires (ou dichotomiques) qui ne comptent que deux modalités ; c'est le cas par exemple pour le sexe, ou pour le codage de la plupart des états pathologiques (présence ou absence de la maladie).
Variable d'intérêt, variable explicative : Une variable est dite explicative si elle influence une autre variable, dite d'intérêt c'est-à-dire qui fait l'objet de l'étude statistique.
La représentation graphique des effectifs d'une variable continue est appelé un histogramme. On portera en abscisses les valeurs des classes des caractères (variables) , et l'on portera en ordonnées les effectifs correspondants , on dit que l'on représente la « structure de la population étudiée ».
En général, on représente la variable indépendante par la lettre «x». Une variable dépendante dans un problème est la donnée du problème qui varie sous l'influence de la variable indépendante. En général, on représente la variable dépendante par la lettre «y».
La représentation graphique de la distribution des probabilités d'une variable qualitative fait appel à 2 types de graphique communément désigné sous les termes : diagramme en bâton et le diagramme circulaire.