Une variable dans le domaine de la recherche est un objet, une idée ou toute autre caractéristique qui peut prendre n'importe quelle valeur que vous essayez de mesurer. Une variable peut être l'âge, la tension artérielle, la taille, le score à un examen, le niveau de la mer, l'heure, etc.
Il existe deux types de variables qualitatives : les variables qualitatives ordinales et les variables qualitatives nominales.
On dit que la variable est nominale si l'on ne choisit ni ordre ni distance, métrique si l'on ne choisit qu'une distance, ordinale si l'on ne choisit qu'un ordre.
On distingue ainsi classiquement trois types de caractères observables, ou encore de variables : les variables nominales, les variables ordinales et les variables métriques.
Une variable discontinue est dite discrète si elle ne contient que des valeurs entières (exemple : nombre d'enfants d'une famille). Par ailleurs, une variable continue accepte toutes les valeurs d'un intervalle fini ou infini (exemple : diamètre de pièces, salaires…).
Si X et Y sont 2 variables quantitatives, la courbe de régression de Y en X est la courbe représentant les moyennes conditionnelles de Y, à X fixé. La courbe de régression de X en Y représente les moyennes conditionnelles de X, à Y fixé.
Variables quantitatives
Une variable quantitative peut être continue ou discontinue. Les variables quantitatives discontinues (ou discrètes) correspondent aux données de dénombrement ; les résultats s'expriment donc sous la forme d'un entier positif (ou nul). Il s'agit par exemple du nombre d'enfants.
Une variable discrète est toujours numérique. Par exemple, le nombre de plaintes de clients ou le nombre de défauts. Les variables continues sont des variables numériques ayant un nombre infini de valeurs entre deux valeurs. Une variable continue peut être numérique ou il peut s'agir de données de date/d'heure.
Les variables doivent avoir un type
Les entiers: qui sont des nombres sans virgule et qui peuvent être positifs ou négatifs.
On distingue divers types de variables selon la nature des données. Ainsi, une variable peut être qualitative ou quantitative; une variable qualitative peut être nominale ou ordinale, alors qu'une variable quantitative peut être continue ou discrète.
Pour faire simple, les données quantitatives fournissent des chiffres qui valident les grands axes de votre étude, alors que les données qualitatives apportent les détails et le contexte pour en comprendre toutes les implications.
L'analyse d'une variable commence par son tri à plat qui est en fait le tableau de la distribution de ses données triées selon ses différentes valeurs : cela consiste tout simplement à dénombrer les résultats obtenus.
pour tester le type d'une variable, on peut faire : type(var) == list (ou str ou int ou float) mais pour tester le type d'une variable, le mieux est isinstance(var, list).
Les variables doivent correspondre exactement à la problématique et se reporter à l'objet et son unité d'échantillonnage. Un ensemble de variables sera complet et pertinent si l'information apportée permet de décrire toutes les situations possibles pour répondre à l'objectif.
Exemple : l'âge est théoriquement une variable quantitative continue, mais en pratique l'âge est mesuré dans le meilleur des cas au jours près.
Variable d'intérêt, variable explicative : Une variable est dite explicative si elle influence une autre variable, dite d'intérêt c'est-à-dire qui fait l'objet de l'étude statistique. Une variable explicative peut servir à stratifier la population.
Une variable indépendante est une variable dont la variation influence la valeur des variables dépendantes. La variable dépendante représente ce que l'on cherche à mesurer dans une expérience ou à évaluer dans une équation mathématique, alors que les variables indépendantes sont les éléments indispensables au calcul.
Description d'une variable
La description d'une variable qualitative consiste à présenter les effectifs, c'est-à-dire le nombre d'individus de l'échantillon pour chaque modalité de la variable, et les fré- quences, c'est-à-dire la proportion des réponses associées à chaque modalité de la variable étudiée.
Une variable continue est une variable qui peut prendre toutes les valeurs possibles d'un intervalle de nombres réels. Dans la liste ci-dessus, on retrouve 2 variables continues. La masse corporelle peut admettre toutes les divisions des kilogrammes et des grammes.
Un caractère qualitatif est un trait qui prend la forme d'un mot, d'une expression ou d'un code (couleur, mot de passe, langue parlée, etc.). Il s'agit donc d'un trait non quantitatif. Un caractère quantitatif est un trait qui prend la forme d'un nombre ou d'une quantité.
Le discret renvoie à une structure dans laquelle on pense un ensemble d'éléments séparément - comme séparés par un « vide » - alors que le continu renvoie au contraire à un ensemble dense : il existe toujours quelque chose entre deux éléments.
Définition. Une variable aléatoire est dite continue si elle peut prendre toutes les valeurs dans un intervalle donné (borné ou non borné).
Le diagramme en bâtons est utilisé dans le cas d'une variable quantitative discrète (figure 4). Il repose sur le même principe que l'histogramme mais les rectangles sont remplacés par des segments (bâtons). Le principal avantage de ce diagramme est qu'il traduit le caractère « isolé » des valeurs.