La taille, le poids, la glycémie, la pression artérielle, la fréquence cardiaque, le nombre d'enfants sont autant de variables quantitatives. Une variable quantitative peut être continue ou discontinue.
Les variables peuvent être classées en deux catégories principales : les catégoriques et les variables numériques. Chacune des catégories se sépare en deux sous-catégories : nominale et ordinales pour les variables catégoriques, discrètes et continues pour les variables numériques.
On distingue divers types de variables selon la nature des données. Ainsi, une variable peut être qualitative ou quantitative; une variable qualitative peut être nominale ou ordinale, alors qu'une variable quantitative peut être continue ou discrète.
On distingue ainsi classiquement trois types de caractères observables, ou encore de variables : les variables nominales, les variables ordinales et les variables métriques.
Variables quantitatives
Une variable quantitative peut être continue ou discontinue. Les variables quantitatives discontinues (ou discrètes) correspondent aux données de dénombrement ; les résultats s'expriment donc sous la forme d'un entier positif (ou nul). Il s'agit par exemple du nombre d'enfants.
Si X et Y sont 2 variables quantitatives, la courbe de régression de Y en X est la courbe représentant les moyennes conditionnelles de Y, à X fixé. La courbe de régression de X en Y représente les moyennes conditionnelles de X, à Y fixé.
Pour connaître le type d'une donnée ou le type de la valeur d'une variable, il suffit d'utiliser la fonction type() .
En algèbre, on tente de généraliser les calculs en remplaçant très souvent les nombres par des lettres. Ces lettres se nomment des variables. Une variable peut être représentée par n'importe quelle lettre de l'alphabet. Dans ces expressions algébriques, les lettres a, b, c, y et z sont des variables.
pour tester le type d'une variable, on peut faire : type(var) == list (ou str ou int ou float) mais pour tester le type d'une variable, le mieux est isinstance(var, list).
Exemple : l'âge est théoriquement une variable quantitative continue, mais en pratique l'âge est mesuré dans le meilleur des cas au jours près.
On dit que la variable est nominale si l'on ne choisit ni ordre ni distance, métrique si l'on ne choisit qu'une distance, ordinale si l'on ne choisit qu'un ordre.
Une variable quantitative peut être discrète ou continue. Une variable discrète a une valeur finie. Il est possible de les énumérer ( » 1, 2, 3,… »). Une variable continue peut prendre, en théorie, une infinité des valeurs, formant un ensemble continu.
On appelle variable de type chaine de caractères, une variable qui contient une ou plusieurs lettres, ou symboles, écrites entre apostrophes ' ' ou entre guillemets “ ”. On appelle variable de type booléen, une variable qui ne prend que deux valeurs : True ou False (vrai ou faux, en français).
Une variable binaire est une variable qui n'a que deux valeurs possibles. Par exemple, lorsqu'un match de basket est joué, il n'y a que deux résultats : gagner ou perdre.
L'analyse d'une variable commence par son tri à plat qui est en fait le tableau de la distribution de ses données triées selon ses différentes valeurs : cela consiste tout simplement à dénombrer les résultats obtenus.
Les variables explicatives, appelées également variables indépendantes, sont celles que nous utilisons dans le but d'expliquer, de décrire ou de prédire la ou les variable(s) dépendante(s). Les variables explicatives sont généralement représentées sur l'axe des abscisses.
Une variable dépendante dans un problème est la donnée du problème qui varie sous l'influence de la variable indépendante. En général, on représente la variable dépendante par la lettre «y». Le temps de cuisson d'un poulet dépend de sa masse. Le nombre de clients d'un magasin et le chiffre d'affaires de ce magasin.
Une variable expliquée est souvent appelée variable endogène et représente une variable qui est expliquée par la théorie ou le modèle que l'on étudie. Elle est provoquée par une ou plusieurs forces internes au système considéré.
Nombre à virgule (float)
En réalité, les nombres réels sont des nombres à virgule flottante, c'est-à-dire un nombre dans lequel la position de la virgule n'est pas fixe, et est repérée par une partie de ses bits (appelée l'exposant), le reste des bits permettent de coder le nombre sans virgule (la mantisse).
– les types réels (mot‐clé float ou double) permettent de représenter les nombres réels (parfois appelés « flottants » en informatique) ; – le type « octet » (mot‐clé char) permet de représenter les variables occupant un seul octet, entre particulier les caractères ; il s'agit en réalité d'un type entier.
Le langage C fournit dix types de base. Le type char sert au stockage de caractères. Les types signed char , short int , int , long int et long long int servent tous à stocker des nombres entiers qui peuvent prendre des valeurs positives, négatives, ou nulles.
Description d'une variable
La description d'une variable qualitative consiste à présenter les effectifs, c'est-à-dire le nombre d'individus de l'échantillon pour chaque modalité de la variable, et les fré- quences, c'est-à-dire la proportion des réponses associées à chaque modalité de la variable étudiée.
Un caractère qualitatif est un trait qui prend la forme d'un mot, d'une expression ou d'un code (couleur, mot de passe, langue parlée, etc.). Il s'agit donc d'un trait non quantitatif. Un caractère quantitatif est un trait qui prend la forme d'un nombre ou d'une quantité.
Une variable quantitative peut être discrète (si ses valeurs sont des nombres entiers, comme le nombre d'enfants) ou continue (si la variable peut prendre toutes les valeurs d'un intervalle, comme le taux de glycémie).