En statistique, une variable qualitative, une variable catégorielle, ou bien un facteur est une variable qui prend pour valeur des modalités, des catégories ou bien des niveaux, par opposition aux variables quantitatives qui mesurent sur chaque individu une quantité.
Une variable nominale décrit un nom, une étiquette ou une catégorie sans ordre naturel. Le sexe et le genre de logement en sont des exemples.
On dit que la variable est nominale si l'on ne choisit ni ordre ni distance, métrique si l'on ne choisit qu'une distance, ordinale si l'on ne choisit qu'un ordre.
Qu'est-ce qu'une échelle nominale ? L'échelle nominale est le premier niveau de mesure. Il est identifié comme des variables nommées. Sur une échelle nominale, les variables reçoivent un nom descriptif ou une étiquette pour représenter leur valeur.
On distingue divers types de variables selon la nature des données. Ainsi, une variable peut être qualitative ou quantitative; une variable qualitative peut être nominale ou ordinale, alors qu'une variable quantitative peut être continue ou discrète.
On distingue ainsi classiquement trois types de caractères observables, ou encore de variables : les variables nominales, les variables ordinales et les variables métriques.
En algèbre, on tente de généraliser les calculs en remplaçant très souvent les nombres par des lettres. Ces lettres se nomment des variables. Une variable peut être représentée par n'importe quelle lettre de l'alphabet. Dans ces expressions algébriques, les lettres a, b, c, y et z sont des variables.
Une variable discontinue est dite discrète si elle ne contient que des valeurs entières (exemple : nombre d'enfants d'une famille). Par ailleurs, une variable continue accepte toutes les valeurs d'un intervalle fini ou infini (exemple : diamètre de pièces, salaires…).
Selon une terminologie classique, ce sont la statistique descriptive et la statistique mathématique. Aujourd'hui, il semble que des expressions comme analyse des données et statistique inférentielle soient préférées, ce qui est justifié par le progrès des méthodes utilisées dans le premier cas.
L'échelle ordinale est similaire à l'échelle nominale exceptée qu'elle permet d'établir une relation d'ordre entre les éléments d'un ensemble, sans toutefois être capable d'évaluer de façon quantitative la distance qui les sépare.
La représentation graphique de la distribution des probabilités d'une variable qualitative fait appel à 2 types de graphique communément désigné sous les termes : diagramme en bâton et le diagramme circulaire.
Variables qualitatives ou catégorielles expriment une qualité comme le sexe, le métier ou le nom.
nominal, nominale, nominaux
1. Relatif au nom désignant quelque chose ou quelqu'un : Ce n'est qu'une erreur nominale. 2. Qui n'existe que de nom et non en fait : N'être qu'un chef nominal.
Une fonction réelle d'une variable réelle associe une valeur réelle à tout nombre de son domaine de définition. Ce type de fonction numérique permet notamment de modéliser une relation entre deux grandeurs physiques.
Une variable binaire est une variable qui n'a que deux valeurs possibles. Par exemple, lorsqu'un match de basket est joué, il n'y a que deux résultats : gagner ou perdre.
On appelle variable qualitative toute autre variable. Une telle variable est dite ordinale si son ensemble de valeurs est muni d'un ordre total significatif (date de naissance, rang, mention au bac, niveau d'étude) et nominale dans le cas contraire (nom, genre, couleur des yeux, groupe sanguin, orientation politique…)
En analyse de données, on distingue principalement deux modèles de données ou variables : les données quantitatives et les données qualitatives. Il existe une différence notable entre une donnée quantitative et une donnée qualitative. Ces deux modèles sont largement utilisés en analyse de données.
Le discret renvoie à une structure dans laquelle on pense un ensemble d'éléments séparément - comme séparés par un « vide » - alors que le continu renvoie au contraire à un ensemble dense : il existe toujours quelque chose entre deux éléments.
Les données discrètes, contrairement aux données continues, sont comptables. Elles ne peuvent être constituées que de nombres entiers. Par exemple, le nombre d'enfants dans une famille ou l'âge (arrondi) d'une personne sont des données discrètes.
Une variable quantitative peut être discrète (si ses valeurs sont des nombres entiers, comme le nombre d'enfants) ou continue (si la variable peut prendre toutes les valeurs d'un intervalle, comme le taux de glycémie).
L'analyse d'une variable commence par son tri à plat qui est en fait le tableau de la distribution de ses données triées selon ses différentes valeurs : cela consiste tout simplement à dénombrer les résultats obtenus.
Les variables doivent correspondre exactement à la problématique et se reporter à l'objet et son unité d'échantillonnage. Un ensemble de variables sera complet et pertinent si l'information apportée permet de décrire toutes les situations possibles pour répondre à l'objectif.
Une variable est un moyen de stocker des valeurs. Pour utiliser une variable, on doit à la fois la déclarer — pour permettre au programme de la connaître — puis on doit lui "affecter" une valeur — pour permettre au programme de savoir quelle valeur nous avons stockée dans la variable.