La représentation graphique de la distribution des probabilités d'une variable qualitative fait appel à 2 types de graphique communément désigné sous les termes : diagramme en bâton et le diagramme circulaire.
VA discrète (quantitative discontinue) Ce type de variable est associée généralement à un diagramme en bâtons où l'axe horizontal des abscisses porte les valeurs prises par la VA (xi) tandis que l'axe vertical des ordonnées porte l'effectif absolu (ni) observé.
Une variable catégorique (aussi appelée variable qualitative) réfère à une caractéristique qui n'est pas quantifiable. Une variable catégorique peut être nominale ou ordinale.
Caractère qualitatif : Une variable statistique est qualitative si ses valeurs, ou modalités, s'expriment de façon littérale ou par un codage sur lequel les opérations arithmétiques telles que moyenne, somme, ... , n'ont pas de sens.
Le diagramme en bâtons est utilisé dans le cas d'une variable quantitative discrète (figure 4). Il repose sur le même principe que l'histogramme mais les rectangles sont remplacés par des segments (bâtons). Le principal avantage de ce diagramme est qu'il traduit le caractère « isolé » des valeurs.
Graphique circulaire (description des composantes) Graphique à barres (comparaison des éléments et relations, série chronologique, distribution de fréquences) Graphique linéaire (série chronologique, distribution de fréquences)
Lorsque le caractère statistique est un nombre (taille, note, nombre d'enfant…) on parle de caractère quantitatif, quand ce caractère n'est pas chiffré (langue parlée, secteur d'activité, couleur...) on parle de caractère qualitatif (soit nominal, soit ordinal).
Une variable peut être représentée par n'importe quelle lettre de l'alphabet. Dans ces expressions algébriques, les lettres a, b, c, y et z sont des variables.
Qui relève de la qualité, de la nature de quelque chose (par opposition à quantitatif) : Une différence qualitative.
Le test le plus utilisé pour tester la liaison entre une variable quantitative et une variable qualitative à deux (2) modalités est le test de Student (alternative test de Man-Withney).
Il s'agit du test de Kruskal-Wallis, mesure de l'association entre deux variables qualitatives.
Il est possible de regrouper les données relatives à deux variables qualitatives sous la forme d'un tableau d'effectifs ou de fréquences. On parle de tableau de contingence. La réalisation d'un tableau de contingence sur R se fait à l'aide de la commande table() .
5.3.2 Quantitatif à qualitatif
Si une variable numérique contient en réalité un petit nombre de valeurs différentes, il suffit de convertir la classe de l'objet de numeric vers factor ou ordered pour que R comprenne que la variable doit être traitée comme une variable qualitative.
Comparer des données
Pour comparer deux ou plusieurs variables, les meilleures représentations graphiques sont les colonnes, le graphique à barres, le graphique en ligne et le graphique combiné (qui mixe par exemple colonnes et points). Les graphiques en colonne sont très utilisés et s'avèrent les plus pratiques.
Exemple : l'âge est théoriquement une variable quantitative continue, mais en pratique l'âge est mesuré dans le meilleur des cas au jours près.
La représentation graphique de la distribution des probabilités d'une variable qualitative fait appel à 2 types de graphique communément désigné sous les termes : diagramme en bâton et le diagramme circulaire.
Une variable dans le domaine de la recherche est un objet, une idée ou toute autre caractéristique qui peut prendre n'importe quelle valeur que vous essayez de mesurer.
Deux variables quantitatives sont corrélées si elles tendent à varier l'une en fonction de l'autre. On parle de corrélation positive si elles tendent à varier dans le même sens, de corrélation négative si elles tendent à varier en sens contraire.
Graphiques à barres et histogrammes
Les graphiques à barres sont généralement utilisés pour éviter l'encombrement lorsqu'un label de données est long ou si il y a plus de 10 éléments à comparer. Ils sont faciles à comprendre et à créer.
En effet, le terme « diagramme » fait référence à toute représentation picturale de données d'une manière qui rend les données plus faciles à comprendre, tandis que le terme « graphique » est plus spécifique et fait référence à la représentation picturale de deux variables ou plus qui contiennent des valeurs numériques ...