On distingue divers types de variables selon la nature des données. Ainsi, une variable peut être qualitative ou quantitative; une variable qualitative peut être nominale ou ordinale, alors qu'une variable quantitative peut être continue ou discrète.
Les variables quantitatives correspondent à des informations que l'on peut mesurer, compter. Cela peut être par exemple : la taille, le poids, l'âge, le nombre d'enfants, etc. Les variables qualitatives correspondent à des informations que l'on ne peut pas mesurer, comme le sexe ou la couleur des cheveux.
On différencie deux types de variables : les variables quantitatives : il s'agit de valeurs numériques, on les appelles aussi continues, les variables qualitatives : il s'agit de variables dont le nombre de valeurs possibles est limité.
Une variable dans le domaine de la recherche est un objet, une idée ou toute autre caractéristique qui peut prendre n'importe quelle valeur que vous essayez de mesurer. Une variable peut être l'âge, la tension artérielle, la taille, le score à un examen, le niveau de la mer, l'heure, etc.
On distingue ainsi classiquement trois types de caractères observables, ou encore de variables : les variables nominales, les variables ordinales et les variables métriques.
Une variable statistique est quantitative si ses valeurs sont des nombres sur lesquels des opérations arithmétiques telles que somme, moyenne, ... ont un sens. Caractère statistique (ou variables statistiques) : C'est ce qui est observé ou mesuré sur les individus d'une population statistique.
Cinq natures de mots sont variables, le plus souvent en genre et en nombre : les déterminants, les noms, les pronoms, les adjectifs qualificatifs et les verbes.
La description d'une variable qualitative consiste à présenter les effectifs, c'est-à-dire le nombre d'individus de l'échantillon pour chaque modalité de la variable, et les fré- quences, c'est-à-dire la proportion des réponses associées à chaque modalité de la variable étudiée.
On appelle variable de type chaine de caractères, une variable qui contient une ou plusieurs lettres, ou symboles, écrites entre apostrophes ' ' ou entre guillemets “ ”. On appelle variable de type booléen, une variable qui ne prend que deux valeurs : True ou False (vrai ou faux, en français).
Selon une terminologie classique, ce sont la statistique descriptive et la statistique mathématique.
Deux variables quantitatives sont corrélées si elles tendent à varier l'une en fonction de l'autre. On parle de corrélation positive si elles tendent à varier dans le même sens, de corrélation négative si elles tendent à varier en sens contraire.
Les variables temporelles
Elles peuvent être de deux types: Type date: 31 octobre 1983. Type horaire: 23 heure 55.
5.3.2 Quantitatif à qualitatif
Si une variable numérique contient en réalité un petit nombre de valeurs différentes, il suffit de convertir la classe de l'objet de numeric vers factor ou ordered pour que R comprenne que la variable doit être traitée comme une variable qualitative.
pour tester le type d'une variable, on peut faire : type(var) == list (ou str ou int ou float) mais pour tester le type d'une variable, le mieux est isinstance(var, list).
l'on dit qu'un caractère est quantitatif discret lorsqu'il ne peut prendre qu'un nombre fini de valeurs numériques. L'on dit qu'un caractère est quantitatif continu lorsqu'il peut prendre une infinité de valeurs numériques et les exemples cités dans les livres sont le salaire d'une population ou la taille en cm.
On peut représenter une variable qualitative ("vs") en fonction d'une variable quantitative ("drat"). La variable quantitative est découpée en classes selon la même méthode qu'un histogramme et dans chaque classe sont calculées les fréquences relatives de chaque modalité de la variable qualitative.
Une variable quantitative peut être discrète (si ses valeurs sont des nombres entiers, comme le nombre d'enfants) ou continue (si la variable peut prendre toutes les valeurs d'un intervalle, comme le taux de glycémie).
Fréquences, médianes, quartiles, déciles, moyennes, variances, etc. sont des statistiques.
Une variable discrète est toujours numérique. Par exemple, le nombre de plaintes de clients ou le nombre de défauts. Les variables continues sont des variables numériques ayant un nombre infini de valeurs entre deux valeurs. Une variable continue peut être numérique ou il peut s'agir de données de date/d'heure.
(i) Une variable d'intérêt est une variable statistique ou une variable aléatoire dont on étudie les propriétés à titre principal, par distinction avec une variable « secondaire », qui peut en faciliter l'étude, ou avec une variable instrumentale, etc.
Une variable nominale est une variable qualitative dont les modalités ne sont pas ordonnées ; par exemple la couleur des yeux (bleus, verts, noirs, ...) Elles peuvent elles aussi être discrètes ou continues.