Caractère statistique (ou variables statistiques) : C'est ce qui est observé ou mesuré sur les individus d'une population statistique. Il peut s'agir d'une variable qualitative ou quantitative. Exemples : Taille, poids, salaire, sexe, profession d'un groupe donné d'individus.
On distingue divers types de variables selon la nature des données. Ainsi, une variable peut être qualitative ou quantitative; une variable qualitative peut être nominale ou ordinale, alors qu'une variable quantitative peut être continue ou discrète.
Description d'une variable
La description d'une variable qualitative consiste à présenter les effectifs, c'est-à-dire le nombre d'individus de l'échantillon pour chaque modalité de la variable, et les fré- quences, c'est-à-dire la proportion des réponses associées à chaque modalité de la variable étudiée.
Les variables quantitatives correspondent à des informations que l'on peut mesurer, compter. Cela peut être par exemple : la taille, le poids, l'âge, le nombre d'enfants, etc. Les variables qualitatives correspondent à des informations que l'on ne peut pas mesurer, comme le sexe ou la couleur des cheveux.
Les variables qualitatives sont soit des variables nominales (renseignées par des lettres), soit des variables numériques mais sans relations d'ordre et de proportionnalité.
Deux variables quantitatives sont corrélées si elles tendent à varier l'une en fonction de l'autre. On parle de corrélation positive si elles tendent à varier dans le même sens, de corrélation négative si elles tendent à varier en sens contraire.
l'on dit qu'un caractère est quantitatif discret lorsqu'il ne peut prendre qu'un nombre fini de valeurs numériques. L'on dit qu'un caractère est quantitatif continu lorsqu'il peut prendre une infinité de valeurs numériques et les exemples cités dans les livres sont le salaire d'une population ou la taille en cm.
Une variable quantitative peut être discrète (si ses valeurs sont des nombres entiers, comme le nombre d'enfants) ou continue (si la variable peut prendre toutes les valeurs d'un intervalle, comme le taux de glycémie).
Exemple : Si les individus de votre étude sont des "êtres humains", la taille est une caractéristique commune à tous les êtres humains. Chaque humain a une taille et cette taille est différente d'un individu à l'autre. Il s'agit donc d'une variable.
Selon une terminologie classique, ce sont la statistique descriptive et la statistique mathématique.
Une variable discrète est toujours numérique. Par exemple, le nombre de plaintes de clients ou le nombre de défauts. Les variables continues sont des variables numériques ayant un nombre infini de valeurs entre deux valeurs. Une variable continue peut être numérique ou il peut s'agir de données de date/d'heure.
Une variable contient une valeur qui peut varier au cours de l'exécution du programme, comme la couleur des habits d'un personnage, le nombre d'activations d'un capteur, etc. On déclare les identifiants des variables. Le logiciel Scratch (mBlock, etc.) fournit la liste des opérations potentielles sur les variables.
L'étude qualitative : est descriptive et se concentre sur des interprétations. Les résultats sont exprimés avec des mots. L'étude quantitative : permet de prouver ou démontrer des faits. Les résultats sont exprimés en chiffres (statistiques).
Lorsque le caractère statistique prend un nombre fini raisonnable de valeurs (note, nombre d'enfants, nombre de pièces, secteur d'activité…), le caractère statistique est discret. Lorsque le caractère statistique peut prendre des valeurs trop nombreuses pour être détaillées (taille, superficie, salaire…)
Un caractère qualitatif est un trait qui prend la forme d'un mot, d'une expression ou d'un code (couleur, mot de passe, langue parlée, etc.). Il s'agit donc d'un trait non quantitatif. Un caractère quantitatif est un trait qui prend la forme d'un nombre ou d'une quantité.
Une variable quantitative peut être discrète ou continue. Une variable discrète a une valeur finie. Il est possible de les énumérer ( » 1, 2, 3,… »). Une variable continue peut prendre, en théorie, une infinité des valeurs, formant un ensemble continu.
Deux grands types sont distingués : les variables quantitatives, sur lesquelles des résumés numériques peuvent être calculés (âge pour des individus, population pour des communes) ; les variables qualitatives, qui regroupent les individus dans un nombre fini de modalités (sexe pour des individus, département d' ...
Une variable nominale est une variable qualitative dont les modalités ne sont pas ordonnées ; par exemple la couleur des yeux (bleus, verts, noirs, ...) Elles peuvent elles aussi être discrètes ou continues.
Fréquences, médianes, quartiles, déciles, moyennes, variances, etc. sont des statistiques.
5.3.2 Quantitatif à qualitatif
Si une variable numérique contient en réalité un petit nombre de valeurs différentes, il suffit de convertir la classe de l'objet de numeric vers factor ou ordered pour que R comprenne que la variable doit être traitée comme une variable qualitative.
Le centre de classe permet de séparer en deux parties égales une série statistique comprenant la même amplitude de nombre des deux côtés. Pour cela, on effectue la moyenne des valeurs extrêmes de chaque classe. Ainsi, si l'on veut connaitre le centre de classe d'une série de [14 ; 19], on fera (14 + 19) / 2 = 17,5.
Les variables explicatives, appelées également variables indépendantes, sont celles que nous utilisons dans le but d'expliquer, de décrire ou de prédire la ou les variable(s) dépendante(s). Les variables explicatives sont généralement représentées sur l'axe des abscisses.
Les variables de type Date affichent les dates au format de date abrégé reconnu par votre ordinateur. Les heures s'affichent au format horaire (plage de 12 ou 24 heures) défini dans votre ordinateur.