Les variables qualitatives nominales sont toutes les variables qualitatives qui ne peuvent pas s'ordonner et ayant trois modalités ou plus, comme la profession ou la couleur de cheveu. Prenons un exemple. A la question « Quelle est la couleur de vos yeux ? », les propositions de réponses sont : bleu, vert, marron.
On distingue ainsi classiquement trois types de caractères observables, ou encore de variables : les variables nominales, les variables ordinales et les variables métriques.
Les variables quantitatives
Ces variables quantitatives peuvent être divisées en deux sous-catégories : les variables continues et les variables discrètes. Une variable continue est une variable qui peut prendre toutes les valeurs possibles d'un intervalle de nombres réels.
On dit que la variable est nominale si l'on ne choisit ni ordre ni distance, métrique si l'on ne choisit qu'une distance, ordinale si l'on ne choisit qu'un ordre.
Pour connaître le type d'une donnée ou le type de la valeur d'une variable, il suffit d'utiliser la fonction type() .
pour tester le type d'une variable, on peut faire : type(var) == list (ou str ou int ou float) mais pour tester le type d'une variable, le mieux est isinstance(var, list).
Une variable quantitative peut être discrète ou continue. Une variable discrète a une valeur finie. Il est possible de les énumérer ( » 1, 2, 3,… »). Une variable continue peut prendre, en théorie, une infinité des valeurs, formant un ensemble continu.
Une variable quantitative peut être continue ou discontinue. Les variables quantitatives discontinues (ou discrètes) correspondent aux données de dénombrement ; les résultats s'expriment donc sous la forme d'un entier positif (ou nul). Il s'agit par exemple du nombre d'enfants.
On différencie deux types de variables : les variables quantitatives : il s'agit de valeurs numériques, on les appelles aussi continues, les variables qualitatives : il s'agit de variables dont le nombre de valeurs possibles est limité.
Exemple : l'âge est théoriquement une variable quantitative continue, mais en pratique l'âge est mesuré dans le meilleur des cas au jours près.
Une variable dans le domaine de la recherche est un objet, une idée ou toute autre caractéristique qui peut prendre n'importe quelle valeur que vous essayez de mesurer. Une variable peut être l'âge, la tension artérielle, la taille, le score à un examen, le niveau de la mer, l'heure, etc.
Une variable discontinue est dite discrète si elle ne contient que des valeurs entières (exemple : nombre d'enfants d'une famille). Par ailleurs, une variable continue accepte toutes les valeurs d'un intervalle fini ou infini (exemple : diamètre de pièces, salaires…).
Les autres variables individuelles Personnalité Caractéristiques mentales et physiques d'un individu. Âge et cycle de vie familial Célibataire, jeune couple avec ou sans enfant, couple âgé avec ou sans enfant. Style de vie Mode de comportement adopté par un individu. Expérience Prise en compte des expériences passées.
Variable d'intérêt, variable explicative : Une variable est dite explicative si elle influence une autre variable, dite d'intérêt c'est-à-dire qui fait l'objet de l'étude statistique. Une variable explicative peut servir à stratifier la population.
Une variable binaire est une variable qui n'a que deux valeurs possibles. Par exemple, lorsqu'un match de basket est joué, il n'y a que deux résultats : gagner ou perdre.
Description d'une variable
La description d'une variable qualitative consiste à présenter les effectifs, c'est-à-dire le nombre d'individus de l'échantillon pour chaque modalité de la variable, et les fré- quences, c'est-à-dire la proportion des réponses associées à chaque modalité de la variable étudiée.
La comparaison de deux variables qualitatives s'appelle en général un tableau croisé . C'est sans doute l'une des analyses les plus fréquentes lors du traitement d'enquêtes en sciences sociales.
Le test du Chi2 consiste à mesurer l'écart entre une situation observée et une situation théorique et d'en déduire l'existence et l'intensité d'une liaison mathématique. Par exemple, en théorie il y a autant de chance d'obtenir « pile » que « face » au lancer d'une pièce de monnaie, en pratique il n'en est rien.
Une variable quantitative peut être discrète (si ses valeurs sont des nombres entiers, comme le nombre d'enfants) ou continue (si la variable peut prendre toutes les valeurs d'un intervalle, comme le taux de glycémie).
Le diagramme en bâtons est utilisé dans le cas d'une variable quantitative discrète (figure 4). Il repose sur le même principe que l'histogramme mais les rectangles sont remplacés par des segments (bâtons). Le principal avantage de ce diagramme est qu'il traduit le caractère « isolé » des valeurs.
Un caractère quantitatif est discret s'il prend un nombre fini de valeurs ou continu, s'il prend toutes les valeurs entre deux limites.
On appelle variable de type chaine de caractères, une variable qui contient une ou plusieurs lettres, ou symboles, écrites entre apostrophes ' ' ou entre guillemets “ ”. On appelle variable de type booléen, une variable qui ne prend que deux valeurs : True ou False (vrai ou faux, en français).
– les types réels (mot‐clé float ou double) permettent de représenter les nombres réels (parfois appelés « flottants » en informatique) ; – le type « octet » (mot‐clé char) permet de représenter les variables occupant un seul octet, entre particulier les caractères ; il s'agit en réalité d'un type entier.
Pour vérifier le type de la variable, vous pouvez utiliser les fonctions is_* .