, la masse, le temps sont des variables quantitatives, de même que la fréquence d'une onde, dans les sciences sociales, l'âge d'une population ou, en psychologie, le quotient intellectuel.
On distingue ainsi classiquement trois types de caractères observables, ou encore de variables : les variables nominales, les variables ordinales et les variables métriques.
Les variables quantitatives
Ces variables quantitatives peuvent être divisées en deux sous-catégories : les variables continues et les variables discrètes. Une variable continue est une variable qui peut prendre toutes les valeurs possibles d'un intervalle de nombres réels.
Une variable discontinue est dite discrète si elle ne contient que des valeurs entières (exemple : nombre d'enfants d'une famille). Par ailleurs, une variable continue accepte toutes les valeurs d'un intervalle fini ou infini (exemple : diamètre de pièces, salaires…).
Une variable quantitative est une variable dont les valeurs sont exprimées par des nombres, accompagnés au besoin d'unités et d'incertitudes. Une variable quantitative est dite discrète si elle ne peut prendre que des valeurs bien précises (des entiers, par exemple, comme celles qui résultent d'un dénombrement).
Les variables quantitatives continues correspondent à des données issues de mesures, comme par exemple la taille, le poids, la pression artérielle, la glycémie, etc.
Une variable quantitative peut être discrète ou continue. Une variable discrète a une valeur finie. Il est possible de les énumérer ( » 1, 2, 3,… »). Une variable continue peut prendre, en théorie, une infinité des valeurs, formant un ensemble continu.
Pour connaître le type d'une donnée ou le type de la valeur d'une variable, il suffit d'utiliser la fonction type() .
On appelle variable de type chaine de caractères, une variable qui contient une ou plusieurs lettres, ou symboles, écrites entre apostrophes ' ' ou entre guillemets “ ”. On appelle variable de type booléen, une variable qui ne prend que deux valeurs : True ou False (vrai ou faux, en français).
Dans le domaine des statistiques, une variable qualitative représente une variable pour laquelle la valeur mesurée sur chaque individu ou catégorie ne représente pas une quantité mais une qualité. Par exemple, les variables peuvent être le sexe, le programme d'études ou encore l'état civil.
Exemple : l'âge est théoriquement une variable quantitative continue, mais en pratique l'âge est mesuré dans le meilleur des cas au jours près.
Si X et Y sont 2 variables quantitatives, la courbe de régression de Y en X est la courbe représentant les moyennes conditionnelles de Y, à X fixé. La courbe de régression de X en Y représente les moyennes conditionnelles de X, à Y fixé.
On dit que la variable est nominale si l'on ne choisit ni ordre ni distance, métrique si l'on ne choisit qu'une distance, ordinale si l'on ne choisit qu'un ordre.
Variable d'intérêt, variable explicative : Une variable est dite explicative si elle influence une autre variable, dite d'intérêt c'est-à-dire qui fait l'objet de l'étude statistique. Une variable explicative peut servir à stratifier la population.
On appelle variable qualitative toute autre variable. Une telle variable est dite ordinale si son ensemble de valeurs est muni d'un ordre total significatif (date de naissance, rang, mention au bac, niveau d'étude) et nominale dans le cas contraire (nom, genre, couleur des yeux, groupe sanguin, orientation politique…)
Nombre à virgule (float)
En réalité, les nombres réels sont des nombres à virgule flottante, c'est-à-dire un nombre dans lequel la position de la virgule n'est pas fixe, et est repérée par une partie de ses bits (appelée l'exposant), le reste des bits permettent de coder le nombre sans virgule (la mantisse).
– les types réels (mot‐clé float ou double) permettent de représenter les nombres réels (parfois appelés « flottants » en informatique) ; – le type « octet » (mot‐clé char) permet de représenter les variables occupant un seul octet, entre particulier les caractères ; il s'agit en réalité d'un type entier.
Le langage C fournit dix types de base. Le type char sert au stockage de caractères. Les types signed char , short int , int , long int et long long int servent tous à stocker des nombres entiers qui peuvent prendre des valeurs positives, négatives, ou nulles.
Description d'une variable
La description d'une variable qualitative consiste à présenter les effectifs, c'est-à-dire le nombre d'individus de l'échantillon pour chaque modalité de la variable, et les fré- quences, c'est-à-dire la proportion des réponses associées à chaque modalité de la variable étudiée.
Un caractère quantitatif est discret s'il prend un nombre fini de valeurs ou continu, s'il prend toutes les valeurs entre deux limites.
On différencie deux types de variables : les variables quantitatives : il s'agit de valeurs numériques, on les appelles aussi continues, les variables qualitatives : il s'agit de variables dont le nombre de valeurs possibles est limité.
Deux grands types sont distingués : les variables quantitatives, sur lesquelles des résumés numériques peuvent être calculés (âge pour des individus, population pour des communes) ; les variables qualitatives, qui regroupent les individus dans un nombre fini de modalités (sexe pour des individus, département d' ...
Le diagramme en bâtons est utilisé dans le cas d'une variable quantitative discrète (figure 4). Il repose sur le même principe que l'histogramme mais les rectangles sont remplacés par des segments (bâtons). Le principal avantage de ce diagramme est qu'il traduit le caractère « isolé » des valeurs.
Le test du Chi2 consiste à mesurer l'écart entre une situation observée et une situation théorique et d'en déduire l'existence et l'intensité d'une liaison mathématique. Par exemple, en théorie il y a autant de chance d'obtenir « pile » que « face » au lancer d'une pièce de monnaie, en pratique il n'en est rien.