Une variable numérique (aussi appelée variable quantitative) est une caractéristique quantifiable dont les valeurs sont des nombres, à l'exclusion des nombres qui correspondent en fait à des codes. Les variables numériques peuvent être continues ou discrètes.
Deux variables quantitatives sont corrélées si elles tendent à varier l'une en fonction de l'autre. On parle de corrélation positive si elles tendent à varier dans le même sens, de corrélation négative si elles tendent à varier en sens contraire.
On distingue divers types de variables selon la nature des données. Ainsi, une variable peut être qualitative ou quantitative; une variable qualitative peut être nominale ou ordinale, alors qu'une variable quantitative peut être continue ou discrète.
Les variables quantitatives correspondent à des informations que l'on peut mesurer, compter. Cela peut être par exemple : la taille, le poids, l'âge, le nombre d'enfants, etc. Les variables qualitatives correspondent à des informations que l'on ne peut pas mesurer, comme le sexe ou la couleur des cheveux.
En statistique descriptive, une variable statistique est dite discrète lorsqu'elle prend un nombre fini raisonnable de valeurs numériques (note, nombre d'enfants, nombre de pièces…). Si ce bandeau n'est plus pertinent, retirez-le.
l'on dit qu'un caractère est quantitatif discret lorsqu'il ne peut prendre qu'un nombre fini de valeurs numériques. L'on dit qu'un caractère est quantitatif continu lorsqu'il peut prendre une infinité de valeurs numériques et les exemples cités dans les livres sont le salaire d'une population ou la taille en cm.
On distingue ainsi classiquement trois types de caractères observables, ou encore de variables : les variables nominales, les variables ordinales et les variables métriques.
Une variable numérique (aussi appelée variable quantitative) est une caractéristique quantifiable dont les valeurs sont des nombres, à l'exclusion des nombres qui correspondent en fait à des codes. Les variables numériques peuvent être continues ou discrètes.
Une variable nominale est une variable qualitative dont les modalités ne sont pas ordonnées ; par exemple la couleur des yeux (bleus, verts, noirs, ...) Elles peuvent elles aussi être discrètes ou continues.
La description d'une variable quantitative se base sur les statistiques suivantes : la moyenne, la médiane, la variance, l'écart-type, les quantiles. On peut aller plus loin en regardant l'asymétrie et l'aplatissement.
Identifier les variables dans des équations
Si vous mettez en équation la relation existant entre ces deux types de variables, le plus simple consiste à donner des noms aux variables, généralement des lettres. La variable qui est isolée dans l'équation est la dépendante.
Les variables qualitatives
On ne peut pas les exploiter mathématiquement. Il est par exemple impossible d'additionner la valeur "marié" et la valeur "divorcé". Si on ne peut pas faire de calcul, on peut cependant les dénombrer, c'est-à-dire compter combien de fois une valeur apparaît.
5.3.2 Quantitatif à qualitatif
Si une variable numérique contient en réalité un petit nombre de valeurs différentes, il suffit de convertir la classe de l'objet de numeric vers factor ou ordered pour que R comprenne que la variable doit être traitée comme une variable qualitative.
Une variable quantitative est soit discrète, soit continue. Si le nombre de valeurs possibles (et probables) d'une variable est très grand, alors on peut la considérer comme continue.
La comparaison de deux variables quantitatives se fait en premier lieu graphiquement, en représentant l'ensemble des couples de valeurs. On peut ainsi représenter les valeurs du nombre d'heures passées devant la télévision selon l'âge. Le fait que des points sont superposés ne facilite pas la lecture du graphique.
Une variable dans le domaine de la recherche est un objet, une idée ou toute autre caractéristique qui peut prendre n'importe quelle valeur que vous essayez de mesurer. Une variable peut être l'âge, la tension artérielle, la taille, le score à un examen, le niveau de la mer, l'heure, etc.
Caractère statistique (ou variables statistiques) :
C'est ce qui est observé ou mesuré sur les individus d'une population statistique. Il peut s'agir d'une variable qualitative ou quantitative. Exemples : Taille, poids, salaire, sexe, profession d'un groupe donné d'individus.
Le brun (et ses variations) reste la couleur la plus courante dans le monde. Le vert est la couleur d'yeux naturelle la plus rare : 2% de la population mondiale contre 70 à 79% pour les yeux bruns.
Certains pensent que la couleur est représentative de la personnalité. La couleur des yeux la plus courante est le marron, pour environ 80% de la population mondiale. Environ 8 à 10% ont les yeux bleus, 5 les yeux noisette et 2% les yeux verts, en faisant la couleur la plus rare.
Il existe deux principaux types de variables quantitatives, à savoir les variables discrètes et les variables continues.
Croiser deux variables quantitatives permet d'aboutir à des indicateurs sur des corrélations entre indicateurs. Enfin, croiser une variable qualitative et une variable quantitative permet de comparer des moyennes, médianes, quantiles, en fonction des modalités de la variable qualitative.
le caractère statistique est considéré comme continu. Lorsque le caractère statistique est un nombre (taille, note, nombre d'enfants…) on parle de caractère quantitatif, quand ce caractère n'est pas chiffré (langue parlée, secteur d'activité, couleur...) on parle de caractère qualitatif (soit nominal, soit ordinal).
Une variable discrète est toujours numérique. Par exemple, le nombre de plaintes de clients ou le nombre de défauts. Les variables continues sont des variables numériques ayant un nombre infini de valeurs entre deux valeurs. Une variable continue peut être numérique ou il peut s'agir de données de date/d'heure.
pour tester le type d'une variable, on peut faire : type(var) == list (ou str ou int ou float) mais pour tester le type d'une variable, le mieux est isinstance(var, list).
Les variables doivent correspondre exactement à la problématique et se reporter à l'objet et son unité d'échantillonnage. Un ensemble de variables sera complet et pertinent si l'information apportée permet de décrire toutes les situations possibles pour répondre à l'objectif.