Les variables peuvent être classées en deux catégories principales : les catégoriques et les variables numériques. Chacune des catégories se sépare en deux sous-catégories : nominale et ordinales pour les variables catégoriques, discrètes et continues pour les variables numériques.
Il existe deux types de variables qualitatives : les variables qualitatives ordinales et les variables qualitatives nominales.
On différencie deux types de variables : les variables quantitatives : il s'agit de valeurs numériques, on les appelles aussi continues, les variables qualitatives : il s'agit de variables dont le nombre de valeurs possibles est limité. Ces valeurs sont appelées modalités.
Deux variables quantitatives sont corrélées si elles tendent à varier l'une en fonction de l'autre. On parle de corrélation positive si elles tendent à varier dans le même sens, de corrélation négative si elles tendent à varier en sens contraire.
Une variable quantitative est une variable dont les valeurs sont exprimées par des nombres, accompagnés au besoin d'unités et d'incertitudes. Une variable quantitative est dite discrète si elle ne peut prendre que des valeurs bien précises (des entiers, par exemple, comme celles qui résultent d'un dénombrement).
La principale différence entre les variables nominales et les variables ordinales est que les variables ordinales ont un ordre de catégories alors que les variables nominales n'en ont pas.
Graphiquement, elle correspond à une droite d'équation réduite y=ax+b qui donne une relation entre les deux variables quantitatives. Grâce à l'ajustement affine, on peut interpoler ou extrapoler, c'est-à-dire faire des prévisions.
Lorsqu'un lien linéaire semble apparaître entre deux variables, et afin de pouvoir faire des interpolations et des extrapolations, il est intéressant d'ajuster le nuage de points au moyen d'une droite et de caractériser ainsi la relation affine entre les deux variables. On parle d'ajustement affine.
Un caractère quantitatif est discret s'il prend un nombre fini de valeurs ou continu, s'il prend toutes les valeurs entre deux limites.
En algèbre, on tente de généraliser les calculs en remplaçant très souvent les nombres par des lettres. Ces lettres se nomment des variables. Une variable peut être représentée par n'importe quelle lettre de l'alphabet. Dans ces expressions algébriques, les lettres a, b, c, y et z sont des variables.
La description d'une variable qualitative consiste à présenter les effectifs, c'est-à-dire le nombre d'individus de l'échantillon pour chaque modalité de la variable, et les fré- quences, c'est-à-dire la proportion des réponses associées à chaque modalité de la variable étudiée.
La comparaison de deux variables quantitatives se fait en premier lieu graphiquement, en représentant l'ensemble des couples de valeurs. On peut ainsi représenter les valeurs du nombre d'heures passées devant la télévision selon l'âge. Le fait que des points sont superposés ne facilite pas la lecture du graphique.
Une variable indépendante est une variable dont la variation influence la valeur des variables dépendantes. La variable dépendante représente ce que l'on cherche à mesurer dans une expérience ou à évaluer dans une équation mathématique, alors que les variables indépendantes sont les éléments indispensables au calcul.
Variable d'intérêt, variable explicative : Une variable est dite explicative si elle influence une autre variable, dite d'intérêt c'est-à-dire qui fait l'objet de l'étude statistique.
Il est possible de regrouper les données relatives à deux variables qualitatives sous la forme d'un tableau d'effectifs ou de fréquences. On parle de tableau de contingence. La réalisation d'un tableau de contingence sur R se fait à l'aide de la commande table() .
Le rapport de corrélation est un indicateur statistique qui mesure l'intensité de la liaison entre une variable quantitative et une variable qualitative. la moyenne globale. Si le rapport est proche de 0, les deux variables ne sont pas liées. Si le rapport est proche de 1, les variables sont liées.
Croiser une variable quantitative et une variable qualitative, c'est essayer de voir si les valeurs de la variable quantitative se répartissent différemment selon la catégorie d'appartenance de la variable qualitative. Cette syntaxe de boxplot utilise une nouvelle notation de type “formule”.
Réponse possible ou attribut d'une donnée d'une distribution d'un caractère statistique qualitatif.
La méthode la plus simple et probablement la plus répandue pour permuter deux variables est d'utiliser une troisième variable temporaire. L'inconvénient de cette méthode est qu'elle nécessite une variable supplémentaire.
Une variable est un moyen de stocker des valeurs. Pour utiliser une variable, on doit à la fois la déclarer — pour permettre au programme de la connaître — puis on doit lui "affecter" une valeur — pour permettre au programme de savoir quelle valeur nous avons stockée dans la variable.
Variables qualitatives ou catégorielles expriment une qualité comme le sexe, le métier ou le nom. Nominales, comme par exemple le nom des journaux, le signe astrologique. Ordinales, désigne le rang : un peu, moyen, beaucoup, énormément, à la folie !
Exemple : l'âge est théoriquement une variable quantitative continue, mais en pratique l'âge est mesuré dans le meilleur des cas au jours près.
La valeur nominale se lit en euros. Il ne faut pas mentionner d'année de base. C'est la lecture la plus simple. La valeur réelle se lit en euros constants et il faut indiquer l'année de base.