En mathématiques, une série statistique est simplement une liste de valeurs d'un même ensemble, dans laquelle l'ordre des termes n'est pas significatif (a contrario d'une série temporelle).
Une caractéristique est une grandeur qu'on utilise pour résumer une série statistique On distingue deux sortes de caractéristique : les caractéristiques de position et les caractéristiques de dispersion. Le mode ou dominante est la valeur la plus fréquente de la variable. C'est la variable qui a le plus grand effectif.
Comment représenter une série statistique ? Pour représenter une variable statistique discrète, on utilise un diagramme en bâtons (chaque bâton a une hauteur proportionnelle à l'effectif et/ou à la fréquence) ou un diagramme circulaire (chaque secteur est proportionnel à l'effectif et/ou à la fréquence).
Étudier une série statistique correspond à l'étude d'un caractère (type de mesure) dans une population (ensemble étudié). Ici, la population désigne les joueurs d'une équipe de rugby et le caractère étudié est l'âge des joueurs. Les valeurs sont toutes les valeurs que peut prendre ce caractère.
Le mode correspond à la donnée qui est la plus fréquente. Pour la trouver, il faut donc déterminer la valeur qui se répète le plus souvent dans une distribution. Soit la distribution suivante. Il est possible qu'une distribution ait plus d'un mode.
Le mode xm est tel que p(xm) ≥ p(x) ou f(xm) ≥ f(x) pour tout x ≠ xm tous deux dans le support de la loi.
Lorsqu'il est unique, le mode est la valeur d'une variable la plus souvent observée dans un ensemble de données et il peut alors être considéré comme une mesure de tendance centrale, au même titre que la moyenne et la médiane. Il est toutefois possible qu'il n'y ait aucun mode ou qu'il y ait plusieurs modes.
Dans un jeu de données de petite taille, il suffit de compter le nombre de valeurs (n) et de les ordonner en ordre croissant. Si le nombre de valeurs est un nombre impair, il faut lui additionner 1, puis le diviser par 2 pour obtenir le rang qui correspondra à la médiane.
Pour représenter graphiquement une série statistique donnée par des valeurs, on utilise un nuage de points, avec en abscisses les valeurs du caractère et en ordonnées l'effectif. Exemple : On étudie le nombre d'enfants dans 200 familles d'un village.
La moyenne, la médiane et le mode sont les mesures principales de tendance centrale d'une série statistique. Elles servent à synthétiser la série étudiée au moyen d'un petit nombre de valeurs "caractéristiques".
L'effectif d'une donnée au sein d'une série statistique correspond au nombre de fois qu'elle y apparaît.
En mathématiques, une série statistique est simplement une liste de valeurs d'un même ensemble, dans laquelle l'ordre des termes n'est pas significatif (a contrario d'une série temporelle).
Pour faire un histogramme, il faut représenter les classes du caractère statistique sur l'axe horizontale. Sur l'axe vertical, il y a souvent l'effectif ou la fréquence. Or, quand plus de précision mathématique est nécessaire, nous devons faire en sorte que les aires représentent les effectifs.
La médiane divise une série statistique en deux parts égales, alors que la moyenne est la somme des valeurs de la série, divisée par le nombre de valeurs de cette même série. Concrètement : la médiane est le point central, elle permet d'éliminer les valeurs extrêmes et d'exprimer la valeur du milieu.
Le mode est la valeur de la variable la plus fréquente de la population étudiée. La médiane est la valeur de la variable qui permet de partager la population étudiée en deux. La variable peut être discrète ou continue.
Pour calculer l'étendue, il suffit de trouver la plus grande valeur observée d'une variable (le maximum) et de lui soustraire la plus petite valeur observée (le minimum). L'étendue ne tient compte que de ces deux valeurs et ignore les points de données entre les deux extrémités de la distribution.
La classe modale est la classe dont la fréquence est la plus élevée, c'est-à-dire la modalité pour laquelle le nombre d'observations est le plus grand.
Déterminer graphiquement la médiane
Sur l'axe des ordonnées, on repère la fréquence cumulée croissante 50%. On rejoint horizontalement la courbe et on redescend verticalement sur l'axe des abscisses pour déterminer la valeur de la médiane.
L'amplitude d'une série statistique, ou d'une classe statistique bornée, est la différence entre la plus grande valeur et la plus petite valeur de cette série (ou de cette classe). L'amplitude de la classe ]a,b] est b−a. b − a .
Dans la distribution représentée par cet histogramme, la classe modale est la classe déterminée par les bornes A et B, soit la classe [48,51[. C'est la classe dont l'effectif est le plus élevé. Pour calculer le mode de la classe modale [48, 51[, on a : LMod=48.
Dans ce cas, il faudra d'abord calculer le centre de chaque intervalle en faisant la moyenne des deux bornes de l'intervalle. Deuxième étape : il faudra multiplier chaque centre d'intervalle par l'effectif correspondant. Enfin, il restera à diviser le résultat par l'effectif total.
La moyenne est calculée en additionnant toutes les valeurs et en divisant la somme par le nombre total de valeurs. La médiane peut être calculée en répertoriant tous les numéros dans l'ordre croissant, puis le nombre dans le centre de distribution.
σ ( X ) = V ( X ) = 1 N ∑ k = 1 N ( x k − X ¯ ) 2 . Si la série statistique est donnée par un tableau statistique (xi,ni) ( x i , n i ) , ce qui signifie que la valeur xi est prise ni fois, on peut directement calculer la variance par la formule : V(X)=1n1+⋯+nNN∑i=1ni(xi−¯X)2.