La comparaison de deux variables quantitatives se fait en premier lieu graphiquement, en représentant l'ensemble des couples de valeurs. On peut ainsi représenter les valeurs du nombre d'heures passées devant la télévision selon l'âge. Le fait que des points sont superposés ne facilite pas la lecture du graphique.
Le cas de deux échantillons indépendants :
Pour comparer deux moyennes, il faut habituellement employer le test «T» de Student, qui suppose la normalité des distributions et l'égalité des variances (test paramétrique), hypothèses invérifiables avec des effectifs faibles.
Deux variables quantitatives sont corrélées si elles tendent à varier l'une en fonction de l'autre. On parle de corrélation positive si elles tendent à varier dans le même sens, de corrélation négative si elles tendent à varier en sens contraire.
La description d'une variable quantitative se base sur les statistiques suivantes : la moyenne, la médiane, la variance, l'écart-type, les quantiles. On peut aller plus loin en regardant l'asymétrie et l'aplatissement.
Croiser une variable quantitative et une variable qualitative, c'est essayer de voir si les valeurs de la variable quantitative se répartissent différemment selon la catégorie d'appartenance de la variable qualitative. Cette syntaxe de boxplot utilise une nouvelle notation de type “formule”.
Le rapport de corrélation est un indicateur statistique qui mesure l'intensité de la liaison entre une variable quantitative et une variable qualitative. la moyenne globale. Si le rapport est proche de 0, les deux variables ne sont pas liées. Si le rapport est proche de 1, les variables sont liées.
Afin d'interpréter les résultats de votre étude, vous devez trier vos données brutes. Le tri le plus simple est le tri à plat. C'est en fait le calcul de pourcentage pour chaque question où cela a un sens. Vous aurez également recours au tri croisé (ou ventilation).
En plaçant chaque élément dans ce système de coordonnées, on obtient un nuage de points (lorsque les deux variables sont quantitatives). Dans un diagramme en secteur (appelé de façon familière «camembert»), les effectifs des différentes classes sont représentés par des secteurs d'angles proportionnels aux effectifs.
La comparaison de deux variables qualitatives s'appelle en général un tableau croisé . C'est sans doute l'une des analyses les plus fréquentes lors du traitement d'enquêtes en sciences sociales.
ANOVA permet de déterminer si la différence entre les valeurs moyennes est statistiquement significative. ANOVA révèle aussi indirectement si une variable indépendante influence la variable dépendante.
Il est possible de regrouper les données relatives à deux variables qualitatives sous la forme d'un tableau d'effectifs ou de fréquences. On parle de tableau de contingence. La réalisation d'un tableau de contingence sur R se fait à l'aide de la commande table() .
Pour étudier le relation entre une variable qualitative et une variable quantita- tive, on décompose la variation totale en variation intergroupe et en variation intragroupe. Pour mesurer l'intensité de la relation (toujours d'un point de vue descriptif), on peut calculer un param`etre appelé rapport de corrélation.
Un test de Student peut être utilisé pour évaluer si un seul groupe diffère d'une valeur connue (test t à un échantillon), si deux groupes diffèrent l'un de l'autre (test t à deux échantillons indépendants), ou s'il existe une différence significative dans des mesures appariées (test de Student apparié ou à ...
Il faut commencer par tester la normalité de la distribution à l'aide du test de Shapiro-Wilk ou du test de Kolmogorov-Smirnov. Si l'hypothèse de normalité n'est pas rejetée, on peut utiliser un test paramétrique. Sinon, on doit utiliser un test non paramétrique.
Les tests de Mann-Whitney servent à vérifier que deux échantillons d'une population ont une position équivalente. Les observations des deux groupes sont combinées et ordonnées, et il leur est attribué un rang moyen en cas d'ex aequo.
Le polygone de fréquence est un graphique linéaire, adapté pour représenter des variables quantitatives continue.
Le graphique le plus adapté dans le cas de deux variables quantitatives est un diagramme de dispersion, qui n'est autre qu'un nuage de points (ou scatter plot, en anglais). Le coefficient de corrélation de Pearson ou coefficient de corrélation linéaire permet de compléter numériquement l'analyse de la corrélation.
Études quantitatives
Les résultats sont souvent exprimés sous forme de données chiffrées (statistiques). Cette méthode peut par exemple être menée à l'aide : D'un sondage (réponse à une question). D'un questionnaire (réponses à plusieurs questions).
Les principales étapes du processus d'analyse consistent à cerner les sujets d'analyse, à déterminer la disponibilité de données appropriées, à décider des méthodes qu'il y a lieu d'utiliser pour répondre aux questions d'intérêt, à appliquer les méthodes et à évaluer, résumer et communiquer les résultats.
Les méthodes quantitatives sont des méthodes de recherche, utilisant des outils d'analyse mathématiques et statistiques, en vue de décrire, d'expliquer et prédire des phénomènes par le biais de données historiques sous forme de variables mesurables.
Le test de corrélation est utilisé pour évaluer une association (dépendance) entre deux variables. Le calcul du coefficient de corrélation peut être effectué en utilisant différentes méthodes.
Les indicateurs quantitatifs font la plupart du temps référence à des unités, des proportions, des ratios ou des taux. Une fois utilisés, ils permettent de récolter des données sous forme de nombres.
le GLM est un outil robuste pour fournir une mesure de l'influence de la variable si celle-ci est globale ; dès lors que l'on souhaite décomposer plus finement la mesure par segment, l'approche non paramétrique fournit des mesures cohérentes, alors que le GLM ne peut plus être utilisé.