Concrètement, une source de données peut être une base de données, un fichier plat, des mesures provenant directement d'appareils physiques, des données obtenues par web scraping ou l'une des nombreux services de données statiques et de données en streaming qui abondent sur Internet.
Que ce soit les moteurs de recherche, les sites d'actualité, les réseaux sociaux, les blogs et les Wiki (sites collaboratifs).
Les plus connus sont par exemple Statistica, Stata ou encore SPSS. Ces logiciels permettent également de travailler sur des données textuelles, mais d'autres outils ont été spécifiquement développés en sciences humaines et sociales pour le traitement statistique de corpus de texte.
Les sources d'information sont habituellement classées en trois grandes catégories : les sources primaires, secondaires et tertiaires.
Les sources primaires pourraient être des journaux personnels, des lettres, des témoignages de témoins oculaires, des rapports officiels, des vidéos personnelles ou des discours. Les sources secondaires pourraient inclure des manuels, des essais, des articles spécialisés, des biographies ou des encyclopédies.
Nature des sources
Les sources écrites sont constituées de textes originaux (manuscrits, correspondance, comptes rendus, etc. ), de documents officiels et d'ouvrages (autobiographies, mémoires de recherche, exposés scientifiques, etc. ), dits de référence, qui permettent de valider l'authenticité de l'information.
Les données peuvent être divisées en 2 grandes catégories. Catégoriques et quantitatives. Les données catégories peuvent être subdivisées en données nominales et ordinales. Les données quantitatives peuvent être discrète ou continue et sont aussi appelées données numériques.
Statistique descriptive et statistique mathématique.
Niveau 1 : Données très sensibles de l'entreprise ou de clients. Niveau 2 : Données internes sensibles. Niveau 3 : Données internes qui ne sont pas destinées à être divulguées au public. Niveau 4 : Données pouvant être divulguées au public.
– Sources internes : données statistiques (ventes, ratios financiers, effectifs…) rapports et notes de services, documents comptables… – Sources externes : médias (presse et internet), partenaires de l'entreprise (clients, fournisseurs, banque, bases de données des greffes…)
On peut dès lors distinguer deux types de sources : les sources primaires et les sources secondaires.
Les sources externes sont tous les documents disponibles en dehors de l'organisation. Elles sont extrêmement nombreuses et de toutes sortes. Exemple : l'Insee (Institut national de la statistique et des études économiques), les catalogues des concurrents, une enquête…
Si vous étudiez comment un événement a affecté les gens à une époque donnée, ce type de source est considéré comme une source primaire. Si l'événement est exploré, l'article d'opinion répondrait à l'événement et serait donc considéré comme une source secondaire.
L'historien peut interroger des témoins sur ce qu'ils ont vu et entendu (sources orales), interroger les textes (sources écrites) et encore interpréter les vestiges matériels (sources archéologiques).
En informatique, le code source est un texte qui présente les instructions composant un programme sous une forme lisible, telles qu'elles ont été écrites dans un langage de programmation. Le code source se matérialise généralement sous la forme d'un ensemble de fichiers texte.
Pour pouvoir être exploitées par l'environnement de Business Intelligence de l'entreprise, ces données doivent être préparées: structuration, déduplication et plus généralement « nettoyage ».
3 – Les principales techniques de collecte de données qualitatives. Les principales techniques de collecte de données qualitatives utiles pour mener une recherche en soins de santé sont les entretiens individuels, les focus groups et l'observation.
Le processus d'analyse de données consiste à collecter des données brutes (raw data) à l'aide d'un outil ou d'une application pour explorer ces informations et découvrir des tendances. Il est ensuite possible de se baser sur les résultats de ces analyses pour prendre de meilleures décisions.