C'est dommage parce qu'en réalité c'est assez simple, il existe, grosso modo, trois grands types d'analyses statistiques : les analyses descriptives, les analyses inférentielles, et les analyses prédictives.
Les données peuvent être divisées en 2 grandes catégories. Catégoriques et quantitatives. Les données catégories peuvent être subdivisées en données nominales et ordinales. Les données quantitatives peuvent être discrète ou continue et sont aussi appelées données numériques.
L'analyse statistique consiste donc à collecter et à interpréter des données dans le but d'identifier des modèles et des tendances.
Un test statistique (ou test d'hypothèse) consiste à détecter une différence significative : Entre une population étudiée et une valeur cible (Test de comparaison à une valeur théorique ou test de -conformité). Entre deux populations (Test de comparaison de population ou test d'homogénéité)
L'analyse statistique est incontournable lors de la réalisation d'une étude de marché. En effet, les statistiques servent à décrire et comprendre un phénomène mais aussi à expliquer l'évolution d'une donnée ou d'un fait.
L'analyse descriptive fait référence à l'analyse des données historiques afin de déterminer ce qui est arrivé, ce qui a changé et quels modèles sont indentifiables.
En analyse de données, les données qualitatives peuvent être divisées en deux grandes catégories : les données qualitatives nominales et les données qualitatives ordinales.
Le choix de la méthode d'analyse doit tenir compte de la nature des résultats recherchés. On doit connaître les caractéristiques de performance "interne" d'une méthode analytique pendant la période considérée lorsqu'on l'utilise sur des substances à analyser.
On peut classer la plupart des méthodes d'échantillonnage en deux grandes catégories : l'échantillonnage aléatoire et l'échantillonnage représentatif. Un échantillon aléatoire est, comme son nom l'indique, un échantillon d'individus sélectionnés au hasard, conçu pour représenter l'ensemble de la population.
Le processus d'analyse de données consiste à collecter des données brutes (raw data) à l'aide d'un outil ou d'une application pour explorer ces informations et découvrir des tendances. Il est ensuite possible de se baser sur les résultats de ces analyses pour prendre de meilleures décisions.
Les quatre types d'analyse de données sont :
Analyse descriptive. Analyse diagnostique. Analyse prédictive. Analyse prescriptive.
L'analytique descriptive est une étape préliminaire du traitement des données qui consiste à synthétiser des données historiques pour en tirer des informations utiles voire les préparer en vue d'une analyse complémentaire.
Les analyses statistiques inférentielles
Les statistiques inférentielles sont souvent définies comme un ensemble de méthodes permettant de généraliser, à l'échelle de la population, des conclusions tirées à partir des données d'un échantillon.
L'analyse des données consiste à examiner des données brutes à l'aide de différentes techniques afin de découvrir des modèles, des corrélations et des idées. Il s'agit de comprendre les données historiques pour en tirer des conclusions éclairées.
Qu'est-ce que l'analyse exploratoire des données ? L'analyse exploratoire des données comprend l'utilisation de graphiques et de visuels pour explorer et analyser un jeu de données. L'objectif est d'explorer, de rechercher et d'apprendre, plutôt que de confirmer les hypothèses statistiques.
La statistique de test compare vos données avec celles attendues d'après l'hypothèse nulle. La statistique de test sert à calculer la valeur de p. Une statistique de test mesure le degré de correspondance entre un échantillon de données et l'hypothèse nulle.
Décrire la situation statistique, c'est donner les in- dividus, éventuellement la population et la taille de l'échantillon, les variables et leur type (dépendante ou indépendante, mais aussi nominale, ordinale ou numérique).
La statistique est la branche des mathématiques qui consiste à recueillir des données, puis à les analyser afin d'établir des hypothèses utilisées pour prédire des évènements. Les statistiques sont les données recueillies et celles obtenues à partir de calculs.
Soit p>0,05: la différence n'est pas significative, on ne peut pas conclure à une différence. Soit p≤0,05: la différence est significative, le risque pris est précisé, sa valeur est appelée degré de signification.