Les boîtes à moustaches vous aident à voir le centre et la distribution des données. Vous pouvez également les utiliser comme un outil visuel pour vérifier la normalité ou pour identifier des points qui peuvent être des
La boîte à moustaches est plus adaptée lorsque l'effectif d'échantillon est d'au moins 20. Si l'effectif d'échantillon est trop petit, les quartiles et les valeurs aberrantes apparaissant dans la boîte à moustaches risquent de ne pas être significatifs.
La boîte à moustaches, parfois appelée diagramme en boîte ou diagramme de quartiles, est un type de diagramme qui permet de visualiser le résumé en cinq nombres.
Principe. La boîte à moustaches résume seulement quelques indicateurs de position du caractère étudié (médiane, quartiles, minimum, maximum ou déciles). Ce diagramme est utilisé principalement pour comparer un même caractère dans deux populations de tailles différentes.
Voici sa construction. 1 - On choisit la partie utile de la droite graduée et une unité. 2 - On trace le corps de la boîte et le trait vertical qui marque la médiane. 3 - On trace les "moustaches".
Le quartile inférieur, ou premier quartile (Q1), est la valeur au-dessous de laquelle se trouvent 25 % des données lorsqu'elles sont arrangées en ordre croissant. Le quartile supérieur, ou troisième quartile (Q3), est la valeur au-dessous de laquelle se trouvent 75 % des données arrangées en ordre croissant.
La boite de dispersion représentera graphiquement cinq descripteurs appelés les cinq nombres. Le premier descripteur des cinq nombres est la médiane qui est la valeur se situant à la moitié des observations, donc, avec autant d'observations plus petites et d'observations plus grande qu'elle.
Trouvez les premier et troisième quartiles.
Il nous faut à présent la médiane de la première moitié de la série (premier quartile). Dans notre exemple de départ, c'est la médiane des valeurs qui se trouvent à gauche du 3. La médiane de 1 et de 2 est 1,5 (nombre pair de valeurs, on fait la moyenne : (1 + 2) / 2).
le premier quartile (noté généralement Q1) est le salaire au-dessous duquel se situent 25 % des salaires ; le deuxième quartile est le salaire au-dessous duquel se situent 50 % des salaires ; c'est la médiane ; le troisième quartile (noté généralement Q3) est le salaire au-dessous duquel se situent 75 % des salaires.
Cliquez sur Rectangles et Barres (à gauche de l'histogramme), puis sur Intervalles et Etiquettes. Changez ensuite le nombre d'intervalles grâce à NClass et observez l'histogramme : En somme dans R++, modifier un histogramme se fait sans code, comme dans MS Excel.
Dans le cas des données quantitatives continues, les graphiques utilisés sont l'histogramme, le polygone des pourcentages et la courbe des pourcentages cumulés ou ogive.
L'interprétation
La lecture d'un diagramme de répartition doit permettre de réaliser une phrase avec une donnée entourée du diagramme. Pour cela il faut : Lire la donnée qui représente l'ensemble étudié. Lire la donnée qui représente une partie de ce total (la donnée entourée).
Un écart type important indique que les données sont dispersées autour de la moyenne. Cela signifie qu'il y a beaucoup de variances dans les données observées. À l'inverse, plus les valeurs sont regroupées autour de la moyenne, plus l'écart type est faible.
Contrairement à l'étendue et à l'écart interquartile, la variance est une mesure qui permet de tenir compte de la dispersion de toutes les valeurs d'un ensemble de données. C'est la mesure de dispersion la plus couramment utilisée, de même que l'écart-type, qui correspond à la racine carrée de la variance.
Un diagramme en boîte ou "boîte à moustaches" est un diagramme donnant des informations sur une série statistique : les valeurs maximale et minimale, les quartiles et la médiane. On donne la série statistique suivante, donnant l'âge des enfants d'une famille.
Un diagramme en boîte permet de représenter une série statistique au moyenne d'une boite rectangulaire sur laquelle sont indiqués les informations suivantes : Le premier quartile Q1 et le troisième quartile Q3, Le premier décile D1 et le troisième décile D3, La médiane Me.
L'histogramme est un outil fréquemment utilisé pour résumer des données discrètes ou continues qui sont présentées par intervalles de valeurs. Il est souvent employé pour montrer les caractéristiques principales de la distribution des données de façon pratique.