La qualité d'une donnée se mesure à travers ses caractéristiques intrinsèques, qu'elles soient internes ou externes à l'entreprise. Nous pouvons citer l'exactitude, l'exhaustivité, la cohérence, la validité, l'actualité, l'intégrité, la clarté ou même la sécurité de la donnée.
La qualité des données compte sept dimensions : exactitude, fiabilité, exhaustivité, caractère opportun, précision, intégrité et confidentialité. Cliquer sur les sept dimensions des données pour en connaître les définitions. en : Des données exactes contiennent des erreurs et une partialité minimales.
Qu'est-ce que la fiabilité des données ? Par fiabilité des données, on entend leur exhaustivité et leur exactitude. Il s'agit d'établir dans quelle mesure elles resteront cohérentes et exemptes d'erreur au fil du temps, quelle que soit leur source. Plus les données sont fiables, plus elles inspirent confiance.
Dans cette section, nous examinons les piliers les plus importants de la gestion de la qualité des données : les personnes, la mesure, les processus, le cadre et la technologie.
Le Data quality manager est chargé de superviser et de garantir la qualité des données. Il veille à ce que les données soient précises, fiables et conformes aux besoins de l'entreprise et aux exigences réglementaires.
Et vous devrez déterminer le type de données dont il s'agit: nominales, ordinales, discrètes ou continues.
La gouvernance des données repose sur 4 piliers principaux : l'organisation, les politiques et standards, les processus, et les outils. Chacun de ces piliers est indispensable à la mise en place d'une gouvernance efficace favorisant l'innovation par la donnée.
Une qualité des données insuffisante peut avoir des conséquences financières sur l'entreprise. En outre, cela induit des pertes de temps et de productivité, imposant aux collaborateurs des tâches chronophages et parfois sans réelle valeur ajoutée.
Contrôle de la fiabilité des données.
Une évaluation chiffrée est possible à partir de la comparaison des résultats de deux ou plusieurs codages. Ce contrôle se fait sur différents échantillons de résultats (par exemple sur 15 % aléatoirement choisis dans l'ensemble des données).
Les critères d'évaluation de l'information sont : la réputation, la crédibilité de l'auteur, la fiabilité des sources, la date de publication et l'exactitude de l'information.
Les informations utiles sont celles dont on a besoin pour répondre à la question posée. Les informations inutiles sont celles qui n'ont aucune importance pour la résolution du problème.
Il men- tionne que les trois types de description de la qualité les plus signalés dans les 270 études consultées sont la qualité désirée, la conscience de la qualité et la conformité au standard de la qualité.
Volume, Vitesse et Variété : la définition du Big Data.
Les 3 piliers de la gouvernance des données : connaissance, qualité et conformité 3 outils dédiés au traitement des données et des métadonnées. Travail et données : ces métiers qui contribuent à rendre leur organisation data-driven.
Optimiser le traitement des données
Pour de nombreux experts, le traitement des données est l'un des enjeux les plus importants du Big Data. En effet, les informations arrivent en masse et se présentent sous divers formats.
Une donnée est ce qui est connu et qui sert de point de départ à un raisonnement ayant pour objet la détermination d'une solution à un problème en relation avec cette donnée.
Vous aussi, vous avez un nom de famille, une date de naissance, un poids, une taille, une nationalité, etc. Toutes ces choses sont des données.
Les 6 dimensions de la qualité des données. La pertinence, l'exactitude, l'actualité l'intelligibilité, la cohérence, l'accessibilité.
Le contrôle qualité est effectué par le personnel de l'entreprise, qui contrôle les matières premières servant à la conception du produit ainsi que la production en cours et le produit fini, avant qu'il ne soit proposé à la vente.
La qualité est avant tout au service de la performance de l'entreprise et en constitue une des conditions principales. Elle permet d'optimiser les moyens et ressources disponibles dans le but d'améliorer l'organisation et son efficacité notamment en facilitant la circulation des informations.
Les exigences pour la qualité sont consignées dans le document d'expression des besoins. Elles sont expriment en termes quantitatifs et/ou qualitatifs les caractéristiques attendues du produit, service ou processus. Elles mettent en avant les caractéristiques clefs et critiques.
Les données inutiles sont la langue d'Ésope des mathématiques. énoncé d'un problème peut sembler incomplet, c'est-à-dire que les données ne semblent pas suffisantes pour sa résolution. Un exemple frappant est le calcul de l'aire d'une couronne dont on ne donne que la longueur l d'une corde tangente au cercle intérieur.