On distingue ainsi classiquement trois types de caractères observables, ou encore de variables : les variables nominales, les variables ordinales et les variables métriques.
Ainsi, une variable peut être qualitative ou quantitative; une variable qualitative peut être nominale ou ordinale, alors qu'une variable quantitative peut être continue ou discrète.
Les expériences nécessitent deux principaux types de variables, à savoir la variable indépendante et la variable dépendante. La variable indépendante est la variable qui est manipulée et qui est supposée avoir un effet direct sur la variable dépendante, la variable étant mesurée et testée.
Les variables quantitatives correspondent à des informations que l'on peut mesurer, compter. Cela peut être par exemple : la taille, le poids, l'âge, le nombre d'enfants, etc. Les variables qualitatives correspondent à des informations que l'on ne peut pas mesurer, comme le sexe ou la couleur des cheveux.
Deux variables quantitatives sont corrélées si elles tendent à varier l'une en fonction de l'autre. On parle de corrélation positive si elles tendent à varier dans le même sens, de corrélation négative si elles tendent à varier en sens contraire.
Par exemple, est-ce que l'âge d'une personne est une variable discrète ou continue? Une personne vieillit continuellement, c'est-à-dire à chaque instant. Il s'agit donc d'une variable continue. Toutefois, il arrive de considérer l'âge d'une personne comme une variable quantitative discrète.
l'on dit qu'un caractère est quantitatif discret lorsqu'il ne peut prendre qu'un nombre fini de valeurs numériques. L'on dit qu'un caractère est quantitatif continu lorsqu'il peut prendre une infinité de valeurs numériques et les exemples cités dans les livres sont le salaire d'une population ou la taille en cm.
Une variable quantitative est soit discrète, soit continue. Si le nombre de valeurs possibles (et probables) d'une variable est très grand, alors on peut la considérer comme continue.
La description d'une variable qualitative est beaucoup plus sommaire. Une fois les modalités de la variable identifiées, il s'agit d'identifier le mode et d'étudier les proportions associées à chaque modalité. Il sera souvent plus intéressant de croiser des variables qualitatives afin d'extraire plus d'information.
Le test du Chi2 consiste à mesurer l'écart entre une situation observée et une situation théorique et d'en déduire l'existence et l'intensité d'une liaison mathématique. Par exemple, en théorie il y a autant de chance d'obtenir « pile » que « face » au lancer d'une pièce de monnaie, en pratique il n'en est rien.
5.3.2 Quantitatif à qualitatif
Si une variable numérique contient en réalité un petit nombre de valeurs différentes, il suffit de convertir la classe de l'objet de numeric vers factor ou ordered pour que R comprenne que la variable doit être traitée comme une variable qualitative.
Comment identifier les variables indépendantes et dépendantes ? Le moyen le plus simple d'identifier dans votre expérience quelles variables sont la variable indépendante (VI) et la variable dépendante (VD) est de mettre les deux variables dans la phrase ci-dessous d'une manière qui a du sens.
On récapitule ! Variables qualitatives ou catégorielles expriment une qualité comme le sexe, le métier ou le nom. Nominales, comme par exemple le nom des journaux, le signe astrologique. Ordinales, désigne le rang : un peu, moyen, beaucoup, énormément, à la folie !
Une variable discrète est toujours numérique. Par exemple, le nombre de plaintes de clients ou le nombre de défauts. Les variables continues sont des variables numériques ayant un nombre infini de valeurs entre deux valeurs. Une variable continue peut être numérique ou il peut s'agir de données de date/d'heure.
On peut donc avoir des variables de nature différente. C'est ce que nous allons voir ci-dessous. Voici une vision d'ensemble des types de variables que nous allons voir. On distingue les variables qualitatives, quantitatives et temporelles.
Un caractère peut être qualitatif (non mesurable) ou quantitatif (mesurable). Un caractère quantitatif est discret s'il prend un nombre fini de valeurs ou continu, s'il prend toutes les valeurs entre deux limites.
Nominal: Utilisé pour classer les données en catégories ou groupes mutuellement exclusifs. Ordinal: Utilisé pour mesurer des variables dans un ordre naturel, comme l'évaluation ou le classement.
Un caractère discret est un caractère qualitatif ou quantitatif prenant un nombre limité de modalités. Si on note N le nombre d'éléments et K le nombre de modalités, on peut distinguer deux cas : K=N : il y a autant de modalités que d'élément.
Selon une terminologie classique, ce sont la statistique descriptive et la statistique mathématique.
Une variable statistique est quantitative si ses valeurs sont des nombres sur lesquels des opérations arithmétiques telles que somme, moyenne, ... ont un sens. Caractère statistique (ou variables statistiques) : C'est ce qui est observé ou mesuré sur les individus d'une population statistique.
Une variable nominale est une variable qualitative dont les modalités ne sont pas ordonnées ; par exemple la couleur des yeux (bleus, verts, noirs, ...) Elles peuvent elles aussi être discrètes ou continues.
Que signifie Variable métrique ? Les variables métriques sont aussi appelées variables quantitatives. Ce sont des variables qui caractérisent des valeurs numériques comme l'âge, la taille ou encore le salaire.
Fréquences, médianes, quartiles, déciles, moyennes, variances, etc. sont des statistiques.