Il existe différentes méthodes pour estimer les quantiles : Soit N le nombre de valeurs observées de la population échantillonnée, et soit x1, x2, ..., xN les valeurs ordonnées de la même population, telles que x1 est la plus petite valeur, etc. Pour le k-ième q-quantile, on a p = k⁄ q.
Le premier quartile Q1 est la plus petite valeur de la série telle qu'au moins 25% des valeurs sont inférieures ou égales à Q1. Le troisième quartile Q3 est la plus petite valeur de la série telle qu'au moins 75% des valeurs sont inférieures ou égales à Q3.
Le quartile inférieur, ou premier quartile (Q1), est la valeur au-dessous de laquelle se trouvent 25 % des données lorsqu'elles sont arrangées en ordre croissant. Le quartile supérieur, ou troisième quartile (Q3), est la valeur au-dessous de laquelle se trouvent 75 % des données arrangées en ordre croissant.
Un quintile représente 20 % d'une population donnée ; le premier quintile représente donc le premier cinquième des données (1 % à 20 %) ; le deuxième quintile représente le deuxième cinquième (21 % à 40 %) et ainsi de suite. Il y a donc 4 quintiles dans une distribution (20 %, 40 %, 60 % et 80 %).
La méthode est identique au cas précédent. On peut utiliser un tableau et cumuler les effectifs pour chercher la médiane et les quartiles. N=20; la moitié est N/2=10; la médiane est une valeur comprise entre la 10e et la 11e valeur soit comprise entre 38 et 39. Le premier quartile est 36 et le troisième est 39.
Lecture des quantiles
Si la série est divisée en 100 parts égales, le quantile est appelé "centile". Si la série est divisée en 10 parts égales, le quantile est appelé "décile".
► Le premier décile est, de manière équivalente, le salaire au-dessus duquel se situent 90 % des salaires ; le neuvième décile est le salaire au-dessus duquel se situent 10 % des salaires : 10 tranches de 10 % (9 déciles). D9 = revenu qui sépare les 90 % les plus pauvres des 10 % les plus riches.
La première méthode illustrée par la capture ci-dessous permet de calculer les quartiles directement dans les cellules en insérant la formule adéquate. Par exemple pour calculer le premier quartile on utilise la formule : =QUARTILE(votre_plage:de_données;1). Le résultat du premier quartile est 484.
- Le troisième quartile (noté Q3) est la valeur d'une série qui est supérieure ou égale à au moins 75 % des données de la série ordonnée de valeurs statistiques.
L'effectif cumulé croissant d'une valeur est égal à la somme de l'effectif de cette valeur plus les effectifs des valeurs qui lui sont inférieures.
Additionnons les effectifs jusqu'à dépasser 25 : 10 + 25 = 35 d'où le premier quartile est à : Q1 = 1450. Calculons le troisième quartile Q3 : 3 × 99 ÷ 4 = 74,25 l'entier immédiatement supérieur est égal à 75. 10 + 25 + 35 + 15 = 85 d'où le troisième quartile est à : Q3 = 1600.
Si on ordonne une distribution de salaires, de revenus, de chiffre d'affaires..., les quartiles sont les valeurs qui partagent cette distribution en quatre parties égales.
La formule Excel pour calculer les quartiles
On va utiliser tout simplement la fonction QUARTILE qui prend comme paramètre d'abord la série de données et le numéro du quart. Donc si on veut le 1er quartile avec 25% des valeurs, on choisit 1,on peut choisir 2 pour la moitié, et 3 pour le 3e quartile.
Les quartiles
Méthode : Pour Q1, on calcule N/4, puis on détermine le premier entier p supérieur ou égal à N/4. Cet entier p est le rang de Q1. Pour Q3, on fait de même avec 3N/4 Exemple : Pour N=15, on a N/4=3,75 et 3N/4 = 11,25. Donc Q1 est la quatrième valeur de la série et Q3 est la douzième valeur.
Si X suit la loi uniforme U[a, b], FX réalise une bijection de I =]a, b[ sur ]0, 1[ et, pour tout p ∈]0, 1[, le p-quantile de X est : (FX)−1(p) = a + (b − a) p .
Il existe une formule simple pour calculer le degré de liberté d'un tableau. dll = (nb de lignes - 1) x (nb de colonnes – 1) où le nombre de lignes et de colonnes s'entend sans les lignes ou colonnes de total.
Cette loi est principalement utilisée dans le test du χ2 basé sur la loi multinomiale pour vérifier l'adéquation d'une distribution empirique à une loi de probabilité donnée. Plus généralement elle s'applique dans le test d'hypothèses à certains seuils (indépendance notamment).
Elle est notamment utilisée pour les tests de Student, la construction d'intervalle de confiance et en inférence bayésienne.
Dans un jeu de données de petite taille, il suffit de compter le nombre de valeurs (n) et de les ordonner en ordre croissant. Si le nombre de valeurs est un nombre impair, il faut lui additionner 1, puis le diviser par 2 pour obtenir le rang qui correspondra à la médiane.
Le niveau de confiance α correspond à la probabilité que l'espérance μ de la loi normale se trouve à l'intérieur de l'intervalle de confiance. Par exemple pour α = 0,95, on a un niveau de confiance de 95 %, correspondant à γ = (1-α)/2 = 0,025.
Contrairement à l'étendue et à l'écart interquartile, la variance est une mesure qui permet de tenir compte de la dispersion de toutes les valeurs d'un ensemble de données. C'est la mesure de dispersion la plus couramment utilisée, de même que l'écart-type, qui correspond à la racine carrée de la variance.
Les quartiles sont trois valeurs qui séparent un ensemble de données placées en ordre croissant en quatre sous-ensembles comprenant exactement le même nombre de données. Le premier quartile, noté Q1 , sépare le premier quart des données du reste des données.
Statistiques pour décrire une variable quantitative
La description d'une variable quantitative se base sur les statistiques suivantes : la moyenne, la médiane, la variance, l'écart-type, les quantiles. On peut aller plus loin en regardant l'asymétrie et l'aplatissement.