On distingue divers types de variables selon la nature des données. Ainsi, une variable peut être qualitative ou quantitative; une variable qualitative peut être nominale ou ordinale, alors qu'une variable quantitative peut être continue ou discrète.
Une variable numérique (aussi appelée variable quantitative) est une caractéristique quantifiable dont les valeurs sont des nombres, à l'exclusion des nombres qui correspondent en fait à des codes. Les variables numériques peuvent être continues ou discrètes.
Les variables qualitatives contiennent des valeurs qui expriment une qualité, un état, c'est-à-dire une condition, un statut unique et exclusif comme le sexe, la couleur ou bien encore la catégorie socioprofessionnelle.
La description d'une variable qualitative consiste à présenter les effectifs, c'est-à-dire le nombre d'individus de l'échantillon pour chaque modalité de la variable, et les fré- quences, c'est-à-dire la proportion des réponses associées à chaque modalité de la variable étudiée.
Les variables indépendantes sont celles qui sont manipulées, tandis que les variables dépendantes sont seulement mesurées ou enregistrées.
Les variables quantitatives continues correspondent à des données issues de mesures, comme par exemple la taille, le poids, la pression artérielle, la glycémie, etc.
Les variables quantitatives
Une variable discrète est une variable qui peut prendre uniquement certaines valeurs d'un intervalle de nombres réels. Généralement, les valeurs admissibles ne sont que les nombres entiers.
VA discrète (quantitative discontinue) Ce type de variable est associée généralement à un diagramme en bâtons où l'axe horizontal des abscisses porte les valeurs prises par la VA (xi) tandis que l'axe vertical des ordonnées porte l'effectif absolu (ni) observé.
On distingue ainsi classiquement trois types de caractères observables, ou encore de variables : les variables nominales, les variables ordinales et les variables métriques.
Caractère qualitatif : Une variable statistique est qualitative si ses valeurs, ou modalités, s'expriment de façon littérale ou par un codage sur lequel les opérations arithmétiques telles que moyenne, somme, ... , n'ont pas de sens.
Un caractère peut être qualitatif (non mesurable) ou quantitatif (mesurable). Un caractère quantitatif est discret s'il prend un nombre fini de valeurs ou continu, s'il prend toutes les valeurs entre deux limites.
A.
Le test statistique est utile lorsqu'il faut trancher entre 2 hypothèses : H0 : hypothèse nulle, elle correspond à une situation de statu quo. H1 : hypothèse alternative, elle correspond à l'hypothèse qu'on veut démontrer.
5.3.2 Quantitatif à qualitatif
Si une variable numérique contient en réalité un petit nombre de valeurs différentes, il suffit de convertir la classe de l'objet de numeric vers factor ou ordered pour que R comprenne que la variable doit être traitée comme une variable qualitative.
pour tester le type d'une variable, on peut faire : type(var) == list (ou str ou int ou float) mais pour tester le type d'une variable, le mieux est isinstance(var, list). isinstance donne True si on teste si un objet contre sa classe, mais aussi contre ses classes de base.
Statistiques pour décrire une variable quantitative
La description d'une variable quantitative se base sur les statistiques suivantes : la moyenne, la médiane, la variance, l'écart-type, les quantiles. On peut aller plus loin en regardant l'asymétrie et l'aplatissement.
Les variables temporelles
Type horaire: 23 heure 55.
On récapitule ! Variables qualitatives ou catégorielles expriment une qualité comme le sexe, le métier ou le nom. Nominales, comme par exemple le nom des journaux, le signe astrologique. Ordinales, désigne le rang : un peu, moyen, beaucoup, énormément, à la folie !
Les variables sont des éléments qui associent un nom (l'identifiant) à une valeur, qui sera implantée dans la mémoire du système programmé. Une variable contient une valeur qui peut varier au cours de l'exécution du programme.
La représentation graphique des effectifs d'une variable continue est appelé un histogramme. On portera en abscisses les valeurs des classes des caractères (variables) , et l'on portera en ordonnées les effectifs correspondants , on dit que l'on représente la « structure de la population étudiée ».
L'histogramme est un outil fréquemment utilisé pour résumer des données discrètes ou continues qui sont présentées par intervalles de valeurs. Il est souvent employé pour montrer les caractéristiques principales de la distribution des données de façon pratique.
le fait de présenter des données sous différentes formes visuelles (p. ex. tableau, graphique à barres, graphique linéaire) permet d'observer et de décrire les tendances et les régularités; cette démarche est interconnectée avec des habiletés comme résumer, comparer ou différencier, inférer, évaluer et conclure.
Les variables continues sont des variables numériques ayant un nombre infini de valeurs entre deux valeurs. Une variable continue peut être numérique ou il peut s'agir de données de date/d'heure. Par exemple, la longueur d'une pièce ou la date et l'heure de réception d'un paiement.
Les différents aspects de la statistique sont regroupés en différents domaines ou concepts : la statistique descriptive, plus couramment appelée aujourd'hui statistique exploratoire, l'inférence statistique, la statistique mathématique, l'analyse des données, l'apprentissage statistique, etc.
La boîte de dialogue Recodage de variables vous permet de réaffecter les valeurs de variables existantes ou de fusionner des plages de valeurs existantes dans de nouvelles valeurs. Par exemple, vous pourriez fusionner des salaires dans des catégories de plages de salaires.