L'écart interquartile est la différence entre le quartile supérieur et le quartile inférieur. L'écart semi-interquartile est la moitié de l'écart interquartile. Lorsque le jeu de données est petit, il est simple de trouver les valeurs des quartiles.
Définition : L'écart interquartile d'une série statistique de premier quartile Q1 et de troisième quartile Q3 est égal à la différence Q3 - Q1. Exemple : Pour la série étudiée dans le chapitre, l'écart interquartile est : Q3 - Q1 = 3 – 1 = 2.
Le rapport interdécile met en relation le 1er et le 9e déciles de la distribution des niveaux de vie mensuels et se calcule comme : D9 / D1. Selon l'Insee, le montant du 1er décile est, en France, en 2019, de 972 euros, tandis que celui du 9e décile est de 3328 euros.
Les quartiles
Méthode : Pour Q1, on calcule N/4, puis on détermine le premier entier p supérieur ou égal à N/4. Cet entier p est le rang de Q1. Pour Q3, on fait de même avec 3N/4 Exemple : Pour N=15, on a N/4=3,75 et 3N/4 = 11,25. Donc Q1 est la quatrième valeur de la série et Q3 est la douzième valeur.
Comment calculer l'écart-type
1 - On calcule la moyenne arithmétique de la série. 2 - On calcule le carré de l'écart à la moyenne de chacune des valeurs de la série. 3 - On calcule la somme des valeurs obtenues. 4 - On divise par l'effectif de la série.
∑ [terme général d'une suite arithmétique] = [nombre de termes] × [premier terme] + [dernier terme] 2 .
L'écart-type est utile quand on compare la dispersion de deux ensembles de données de taille semblable qui ont approximativement la même moyenne. L'étalement des valeurs autour de la moyenne est moins important dans le cas d'un ensemble de données dont l'écart-type est plus petit.
Par estimation. Il existe différentes méthodes pour estimer les quantiles : soit N le nombre de valeurs observées de la population échantillonnée, et soit x1, x2, ..., xN les valeurs ordonnées de la même population, telles que x1 est la plus petite valeur, etc. Pour le k-ième q-quantile, on a p = k⁄ q.
Si on ordonne une distribution de salaires, de revenus, de chiffre d'affaires..., les quartiles sont les valeurs qui partagent cette distribution en quatre parties égales.
Calcul des déciles
Le décile est calculé en tant que 10-quantile : le seuil du 1er décile sépare le jeu de données entre les 10 % inférieurs et le reste des données. le seuil du 9e décile sépare les 90 % inférieurs des données des 10 % supérieurs.
Le coefficient multiplicateur permet d'étudier l'évolution de la valeur d'une variable entre deux dates. Ainsi, il est obtenu en divisant la valeur d'arrivée par la valeur de départ. S'il est supérieur à 1, le coefficient multiplicateur traduit une augmentation.
Ainsi, interpréter la courbe de Lorenz est plutôt simple. Si nous prenons l'exemple du graphique ci-dessus, voici la lecture que nous pouvons en faire : - Les 50% de la population les plus pauvres perçoivent 5% du revenu total. - Cela signifie que 50% des plus riches détiennent 95% des revenus.
Remarque L'écart interquartile indique la longueur de l'intervalle dans lequel la moitié centrale des valeurs de la série sont comprises. Propriété Au moins 50 % des valeurs de la série sont comprises dans l'intervalle interquartile.
La médiane est le point milieu d'un jeu de données, de sorte que 50 % des unités ont une valeur inférieure ou égale à la médiane et 50 % des unités ont une valeur supérieure ou égale. Dans un jeu de données de petite taille, il suffit de compter le nombre de valeurs (n) et de les ordonner en ordre croissant.
Les plus courants sont la variance, l'écart-type et l'écart interquartile. Ces indicateurs complètent l'information apportée par les indicateurs de position ou de tendance centrale, mesurés par la moyenne ou la médiane.
La médiane divise une série statistique en deux parts égales, alors que la moyenne est la somme des valeurs de la série, divisée par le nombre de valeurs de cette même série. Concrètement : la médiane est le point central, elle permet d'éliminer les valeurs extrêmes et d'exprimer la valeur du milieu.
Calculer l'effectif total
On calcule N, l'effectif total de la série statistique grâce à la formule N = \sum_{i=1}^{p}n_i. Où n_i est l'effectif associé à la valeur x_i.
Fractile, subst. masc.,stat., sociol. Fraction, partie d'une population ou d'un échantillon, classée suivant sa valeur.
Les quantiles sont des mesures utiles parce qu'elles sont moins sensibles aux distributions allongées et aux valeurs aberrantes. XLSTAT permet d'utiliser cinq méthodes de calcul des quantiles : Méthode de la moyenne pondérée à x(Np) Méthode de l'observation la plus proche de x(N*p)
Le 1er quartile, noté Q1, est la valeur qui sépare le premier quart du reste de la distribution. Le 2e quartile, noté Q2, est la valeur qui sépare la distribution en 2 parties égales. Autrement dit, il s'agit de la médiane. Le 3e quartile, noté Q3, est la valeur qui sépare le dernier quart du reste de la distribution.
L'écart-type est un outil statistique qui permet d'estimer la dispersion des valeurs par rapport à la moyenne. Plus l'écart-type a une valeur élevée, plus les données sont dispersées par rapport à la moyenne. L'unité de l'écart-type est la même que celle de la moyenne.
À l'inverse, plus les valeurs sont regroupées autour de la moyenne, plus l'écart type est faible. Si l'écart type est proche de zéro, les données sont alors très peu dispersées par rapport à la moyenne. L'écart type ne peut pas être négatif.
La variance est utilisée dans le domaine de la statistique et de la probabilité en tant que mesure servant à caractériser la dispersion d'une distribution ou d'un échantillon. Il est possible de l'interpréter comme la dispersion des valeurs par rapport à la moyenne.
Le symbole Σ (sigma) s'utilise pour désigner de manière générale la somme de plusieurs termes. Ce symbole est généralement accompagné d'un indice que l'on fait varier de façon à englober tous les termes qui doivent être considérés dans la somme.