La fonction la plus utilisée pour le traitement et l'analyse des variables qualitatives (variable prenant ses valeurs dans un ensemble de modalités ) est sans aucun doute la fonction table , qui donne les effectifs de chaque modalité de la variable, ce qu'on appelle un tri à plat ou tableau de fréquences .
La description d'une variable qualitative est beaucoup plus sommaire. Une fois les modalités de la variable identifiées, il s'agit d'identifier le mode et d'étudier les proportions associées à chaque modalité. Il sera souvent plus intéressant de croiser des variables qualitatives afin d'extraire plus d'information.
Étude statistique des modalités d'une seule variable, ou de plusieurs variables considérées indépendamment, dans le but de décrire l'échantillon.
L'analyse univariée a pour but de décrire et mesurer la répartition des valeurs que peut prendre une variable.
À quelques exceptions près, il n'est pas possible de transformer une variable qualitative en variable quantitative. En revanche, il est possible de transformer une variable quantitative en variable qualitative, en la divisant en tranches notamment.
Pour savoir si la distribution des réponses de deux variables qualitatives est due au hasard ou si elle révèle une liaison entre elles, on utilise généralement le test du Khi2 dit «Khi-deux».
Le test du Chi2 consiste à mesurer l'écart entre une situation observée et une situation théorique et d'en déduire l'existence et l'intensité d'une liaison mathématique. Par exemple, en théorie il y a autant de chance d'obtenir « pile » que « face » au lancer d'une pièce de monnaie, en pratique il n'en est rien.
On entend par statistique univariée l'étude d'une seule variable, que celle-ci soit quantitative ou qualitative. La statistique univariée fait partie de la statistique descriptive .
Les principales étapes du processus d'analyse consistent à cerner les sujets d'analyse, à déterminer la disponibilité de données appropriées, à décider des méthodes qu'il y a lieu d'utiliser pour répondre aux questions d'intérêt, à appliquer les méthodes et à évaluer, résumer et communiquer les résultats.
Une technique univariée s'attache à une seule série d'un caractère donné ou à une seule mesure (même s'il y a plusieurs échantillons). Une technique multivariée analyse les éventuelles relations existant entre plusieurs caractères. Lorsque ceux-ci ne sont que deux, on parle d'analyse bivariée.
Pour faire une analyse multivariée, il faut déterminer la variable à expliquer en fonction de l'objectif poursuivi, choisir la méthode, puis identifier les variables explicatives.
Les résultats de l'étude qualitative sont généralement décrits avec des mots, mais il est aussi possible d'utiliser des tableaux, graphiques ou des images.
Le rapport de corrélation est un indicateur statistique qui mesure l'intensité de la liaison entre une variable quantitative et une variable qualitative. la moyenne globale. Si le rapport est proche de 0, les deux variables ne sont pas liées. Si le rapport est proche de 1, les variables sont liées.
Le test t est un test d'hypothèse statistique utilisé pour comparer les moyennes de deux groupes de population. L'ANOVA est une technique d'observation utilisée pour comparer les moyennes de plus de deux groupes de population.
Analyse de la variance (ANOVA) est une formule statistique utilisée pour comparer les variances entre la ou les moyennes de différents groupes. Elle est utilisée dans de nombreux scénarios pour déterminer s'il existe une différence entre les moyennes de différents groupes.
L'ANOVA univariée est généralement utilisée lorsque l'on a une seule variable indépendante, ou facteur, et que l'objectif est de vérifier si des variations, ou des niveaux différents de ce facteur ont un effet mesurable sur une variable dépendante.
Il existe deux types de variables qualitatives : les variables qualitatives ordinales et les variables qualitatives nominales.
Une variable catégorique (aussi appelée variable qualitative) réfère à une caractéristique qui n'est pas quantifiable. Une variable catégorique peut être nominale ou ordinale.
La représentation graphique de la distribution des probabilités d'une variable qualitative fait appel à 2 types de graphique communément désigné sous les termes : diagramme en bâton et le diagramme circulaire.