Pour représenter une variable quantitative continue, l'histogramme est le plus adéquat. Il regroupe les différentes valeurs prises par la variable en classes.
VA discrète (quantitative discontinue) Ce type de variable est associée généralement à un diagramme en bâtons où l'axe horizontal des abscisses porte les valeurs prises par la VA (xi) tandis que l'axe vertical des ordonnées porte l'effectif absolu (ni) observé.
On peut représenter une variable qualitative ("vs") en fonction d'une variable quantitative ("drat"). La variable quantitative est découpée en classes selon la même méthode qu'un histogramme et dans chaque classe sont calculées les fréquences relatives de chaque modalité de la variable qualitative.
Quand on parle de variable, on préfère la nommer avec une majuscule. Par contre, ce qui est une observation (= une réalisation) de la variable, on le note par des lettres minuscules. Ici, (x1,...,xn) est une réalisation observée de la variable aléatoire X .
La description d'une variable quantitative se base sur les statistiques suivantes : la moyenne, la médiane, la variance, l'écart-type, les quantiles. On peut aller plus loin en regardant l'asymétrie et l'aplatissement.
Une variable quantitative est une variable dont les valeurs sont exprimées par des nombres, accompagnés au besoin d'unités et d'incertitudes. Une variable quantitative est dite discrète si elle ne peut prendre que des valeurs bien précises (des entiers, par exemple, comme celles qui résultent d'un dénombrement).
Deux variables quantitatives sont corrélées si elles tendent à varier l'une en fonction de l'autre. On parle de corrélation positive si elles tendent à varier dans le même sens, de corrélation négative si elles tendent à varier en sens contraire.
L'analyse d'une variable commence par son tri à plat qui est en fait le tableau de la distribution de ses données triées selon ses différentes valeurs : cela consiste tout simplement à dénombrer les résultats obtenus.
Identifier les variables dans des équations
Si vous mettez en équation la relation existant entre ces deux types de variables, le plus simple consiste à donner des noms aux variables, généralement des lettres. La variable qui est isolée dans l'équation est la dépendante.
Les données issues de séries statistiques doubles avec une variable qualitative, l'autre quantitative, sont représentées graphiquement par une série de courbes de fréquence ou d'histogrammes (voir aussi page 78). Chaque courbe ou histogramme se rapporte alors à une catégorie de la variable qualitative.
5.3.2 Quantitatif à qualitatif
Si une variable numérique contient en réalité un petit nombre de valeurs différentes, il suffit de convertir la classe de l'objet de numeric vers factor ou ordered pour que R comprenne que la variable doit être traitée comme une variable qualitative.
Le rapport de corrélation est un indicateur statistique qui mesure l'intensité de la liaison entre une variable quantitative et une variable qualitative. la moyenne globale. Si le rapport est proche de 0, les deux variables ne sont pas liées. Si le rapport est proche de 1, les variables sont liées.
Les graphiques en courbes, à barres et les histogrammes représentent des changements dans le temps. Les graphiques en pyramide ou en secteurs représentent les parties d'un tout. Quant aux nuages de points et les cartes proportionnelles sont pratiques si vous avez de nombreuses données à visualiser.
Comparer des données
Pour comparer deux ou plusieurs variables, les meilleures représentations graphiques sont les colonnes, le graphique à barres, le graphique en ligne et le graphique combiné (qui mixe par exemple colonnes et points). Les graphiques en colonne sont très utilisés et s'avèrent les plus pratiques.
Comment représenter une série statistique ? Pour représenter une variable statistique discrète, on utilise un diagramme en bâtons (chaque bâton a une hauteur proportionnelle à l'effectif et/ou à la fréquence) ou un diagramme circulaire (chaque secteur est proportionnel à l'effectif et/ou à la fréquence).
On distingue ainsi classiquement trois types de caractères observables, ou encore de variables : les variables nominales, les variables ordinales et les variables métriques.
Une variable nominale est une variable qualitative dont les modalités ne sont pas ordonnées ; par exemple la couleur des yeux (bleus, verts, noirs, ...) Elles peuvent elles aussi être discrètes ou continues.
Une variable quantitative peut être discrète ou continue. Une variable discrète a une valeur finie. Il est possible de les énumérer ( » 1, 2, 3,… »). Une variable continue peut prendre, en théorie, une infinité des valeurs, formant un ensemble continu.
Un caractère quantitatif discret est un trait qui peut seulement prendre certaines valeurs dans un intervalle donné. En général, ce sont des quantités qui peuvent être comptées, c'est-à-dire qui ont la forme d'un nombre naturel.
pour tester le type d'une variable, on peut faire : type(var) == list (ou str ou int ou float) mais pour tester le type d'une variable, le mieux est isinstance(var, list).
L'histogramme est un outil fréquemment utilisé pour résumer des données discrètes ou continues qui sont présentées par intervalles de valeurs. Il est souvent employé pour montrer les caractéristiques principales de la distribution des données de façon pratique.
Le nuage de points est un outil graphique qui permet de mettre en exergue la relation entre deux variables quantitatives. Généralement, la variable en abscisse représente la variable de cause et la variable en ordonnée représente la variable de réponse.
Une variable quantitative est soit discrète, soit continue. Si le nombre de valeurs possibles (et probables) d'une variable est très grand, alors on peut la considérer comme continue.
La comparaison de deux variables quantitatives se fait en premier lieu graphiquement, en représentant l'ensemble des couples de valeurs. On peut ainsi représenter les valeurs du nombre d'heures passées devant la télévision selon l'âge. Le fait que des points sont superposés ne facilite pas la lecture du graphique.