Une variable continue est une variable qui peut prendre toutes les valeurs possibles d'un intervalle de nombres réels. Une variable discrète est une variable qui peut prendre uniquement certaines valeurs d'un intervalle de nombres réels. Généralement, les valeurs admissibles ne sont que les nombres entiers.
Un caractère peut être qualitatif (non mesurable) ou quantitatif (mesurable). Un caractère quantitatif est discret s'il prend un nombre fini de valeurs ou continu, s'il prend toutes les valeurs entre deux limites.
Une variable quantitative est une variable dont les valeurs sont exprimées par des nombres, accompagnés au besoin d'unités et d'incertitudes. Une variable quantitative est dite discrète si elle ne peut prendre que des valeurs bien précises (des entiers, par exemple, comme celles qui résultent d'un dénombrement).
le support et on le note SX. , on dit que la variable aléatoire est discrète. Lorsque les résultats possibles d'une v.a. est un intervalle de l'ensemble des nombres réels, on dit que la v.a. est continue.
Les données discrètes, contrairement aux données continues, sont comptables. Elles ne peuvent être constituées que de nombres entiers. Par exemple, le nombre d'enfants dans une famille ou l'âge (arrondi) d'une personne sont des données discrètes.
Variables continues
On dit qu'une variable est continue si elle prend un nombre infini de valeurs réelles possibles à l'intérieur d'un intervalle donné. Prenons la taille d'un élève par exemple. La taille ne peut pas prendre n'importe quelle valeur. Elle ne peut pas être négative, ni être plus grande que trois mètres.
On distingue ainsi classiquement trois types de caractères observables, ou encore de variables : les variables nominales, les variables ordinales et les variables métriques.
Exemple : l'âge est théoriquement une variable quantitative continue, mais en pratique l'âge est mesuré dans le meilleur des cas au jours près.
Définition : On dit qu'une variable aléatoire X est absolument continue s'il existe une fonction f , positive et intégrable, telle que, pour tout intervalle I de R , on ait : PX(I)=P(X∈I)=∫If(t)dt.
Les variables quantitatives continues correspondent à des données issues de mesures, comme par exemple la taille, le poids, la pression artérielle, la glycémie, etc.
pour tester le type d'une variable, on peut faire : type(var) == list (ou str ou int ou float) mais pour tester le type d'une variable, le mieux est isinstance(var, list). isinstance donne True si on teste si un objet contre sa classe, mais aussi contre ses classes de base.
La représentation graphique des effectifs d'une variable continue est appelé un histogramme. On portera en abscisses les valeurs des classes des caractères (variables) , et l'on portera en ordonnées les effectifs correspondants , on dit que l'on représente la « structure de la population étudiée ».
VA discrète (quantitative discontinue) Ce type de variable est associée généralement à un diagramme en bâtons où l'axe horizontal des abscisses porte les valeurs prises par la VA (xi) tandis que l'axe vertical des ordonnées porte l'effectif absolu (ni) observé.
Lorsque le caractère statistique prend un nombre fini raisonnable de valeurs (note, nombre d'enfants, nombre de pièces, secteur d'activité…), le caractère statistique est discret.
Pour savoir si la distribution des réponses de deux variables qualitatives est due au hasard ou si elle révèle une liaison entre elles, on utilise généralement le test du Khi2 dit «Khi-deux».
Mode : La valeur la plus fréquente d'une série statistique — C'est la (ou les) valeur(s) du caractère dont l'effectif est le plus grand. Exemple : le mode de la série {4 , 2, 4, 3, 2, 2} est 2 car il apparaît trois fois. 2 est la valeur qui a le plus grand nombre d'occurrences.
Le calcul de la médiane se fait à partir des effectifs ou des fréquences cumulées. La médiane est la valeur de la variable à laquelle est associé un effectif cumulé égal à N / 2, ou une fréquence cumulée égale à 0,5, N étant effectif total de la population.
La moyenne est utilisée pour des distributions normales, ayant un faible nombre de valeurs aberrantes. La médiane est généralement utilisée pour retourner la tendance centrale des distributions asymétriques.
Statistiques pour décrire une variable quantitative
La description d'une variable quantitative se base sur les statistiques suivantes : la moyenne, la médiane, la variance, l'écart-type, les quantiles. On peut aller plus loin en regardant l'asymétrie et l'aplatissement.
Une variable quantitative peut être discrète (si ses valeurs sont des nombres entiers, comme le nombre d'enfants) ou continue (si la variable peut prendre toutes les valeurs d'un intervalle, comme le taux de glycémie).
Deux variables quantitatives sont corrélées si elles tendent à varier l'une en fonction de l'autre. On parle de corrélation positive si elles tendent à varier dans le même sens, de corrélation négative si elles tendent à varier en sens contraire.
Variable indépendante :
Comme son nom l'indique, une variable indépendante (VI) est autonome. La valeur ne change pas en raison de l'impact de toute autre variable. Le chercheur manipule ou modifie la variable indépendante pour mesurer son impact sur d'autres variables.
Une variable statistique est quantitative si ses valeurs sont des nombres sur lesquels des opérations arithmétiques telles que somme, moyenne, ... ont un sens. Caractère statistique (ou variables statistiques) : C'est ce qui est observé ou mesuré sur les individus d'une population statistique.
On récapitule ! Variables qualitatives ou catégorielles expriment une qualité comme le sexe, le métier ou le nom. Nominales, comme par exemple le nom des journaux, le signe astrologique. Ordinales, désigne le rang : un peu, moyen, beaucoup, énormément, à la folie !