Tout d'abord, pourquoi faire des tests statistiques ? Les tests statistiques (ou tests d'hypothèses) vont vous permettre de tirer des conclusions claires, mathématiquement rigoureuses (et élégantes !) à partir des données que vous aurez analysées.
Le but de la statistique est d'extraire des informations pertinentes d'une liste de nombres difficile à interpréter par une simple lecture.
Son objectif peut se résumer de la façon suivante : dégager, à partir de données observées sur quelques individus d'une population, des résultats valables pour l'ensemble de la population.
La science des statistiques est utile pour choisir objectivement un échantillon, faire des généralisations valables à partir des observations faites sur l'ensemble d'échantillons, mais aussi pour mesurer le degré d'incertitude, ou la fiabilité, des conclusions tirées.
Un test statistique permet d'évaluer à quel point les données vont à l'encontre d'une certaine hypothèse, l'hypothèse nulle aussi appelée H0. Sous H0, les données sont générées par le hasard. En d'autres termes, les processus contrôlés (manipulations expérimentales par exemple) n'ont pas d'influence sur les données.
Les tests statistiques permettent de contrôler la validité d'une hypothèse émise sur une population-mère, à partir des observations effectuées sur un échantillon. L'hypothèse ainsi énoncée est appelée hypothèse nulle ou H0.
La statistique est la science qui consiste à réunir des données chiffrées, à les analyser et à les commenter. Une étude statistique s'effectue sur un ensemble appelé population dont les éléments sont appelés individus et consiste à observer et étudier un même aspect sur chaque individu, appelé caractère.
La statistique est une méthode mathématique, avec collecte et description de données, qui permet l'analyse et l'inférence de conclusions à partir des données quantitatives. Les statistiques sont une introduction à la valeur attendue, la variance, l'écart type, la covariance, la corrélation et l'interpolation.
La statistique utile aux entreprises est précisément celle qui leur permet de ne pas se tromper, c'est celle qui leur permet de bien choisir entre les possibilités qui leur sont offertes pour l'interprétation des données.
Les données peuvent être divisées en 2 grandes catégories. Catégoriques et quantitatives. Les données catégories peuvent être subdivisées en données nominales et ordinales. Les données quantitatives peuvent être discrète ou continue et sont aussi appelées données numériques.
Les statistiques inférentielles sont généralement utilisées pour tester des hypothèses et tirer des conclusions sur une population à partir d'un échantillon. Ils sont utilisés pour faire des prédictions, estimer des paramètres et tester l'importance des différences entre les groupes.
On effectue une étude statistique par le relevé de certaines données sur une population. Les données sont, suivant les besoins, sous forme de listes, de tableaux d'effectifs ou de diagrammes. À partir de ces données, on effectue des calculs qui nous renseignent sur cette étude.
Décrire la situation statistique, c'est donner les in- dividus, éventuellement la population et la taille de l'échantillon, les variables et leur type (dépendante ou indépendante, mais aussi nominale, ordinale ou numérique).
Une hypothèse statistique est un énoncé (une affirmation) concernant les caractéristiques (valeurs des paramètres, forme de la distribution des observations) d'une population.
Comment formuler une hypothèse ? Pour formuler une hypothèse, il faut d'abord définir une question de recherche. Une hypothèse formulée avec précision sur la population peut ensuite être dérivée de la question de recherche, par exemple : les hommes gagnent plus que les femmes pour un même emploi en Autriche.
1) Choisir un échantillon de personnes à questionner. 2) Définir le type de questions à poser : questions fermées, ouvertes, etc. 3) Structurer le questionnaire. 4) Déterminer l'endroit où doit se dérouler l'enquête (dans la rue, par courrier, sur internet, etc.).
La méthodologie d'étude est constituée par l'ensemble des décisions prises à chaque étape de l'étude. En effet, une étude peut être menée : par sondage, entretiens de groupe, tests, observations, etc. sur des échantillons de différentes tailles et compositions.
On peut classer la plupart des méthodes d'échantillonnage en deux grandes catégories : l'échantillonnage aléatoire et l'échantillonnage représentatif. Un échantillon aléatoire est, comme son nom l'indique, un échantillon d'individus sélectionnés au hasard, conçu pour représenter l'ensemble de la population.
Caractère statistique (ou variables statistiques) :
C'est ce qui est observé ou mesuré sur les individus d'une population statistique. Il peut s'agir d'une variable qualitative ou quantitative. Exemples : Taille, poids, salaire, sexe, profession d'un groupe donné d'individus.
L'analyse descriptive est le terme donné à l'analyse des données permettant de décrire et de résumer des données historiques de manière significative afin que, par exemple, des insights en ressortent. L'analyse descriptive permet de répondre à la question « Que c'est-il passé ? »