gros adj (gros m sg, grosse f sg, gros m pl, grosses f pl)
Le gigantesque volume de données numériques produites combiné aux capacités sans cesse accrues de stockage et à des outils d'analyse en temps réel de plus en plus sophistiqués offre aujourd'hui des possibilités inégalées d'exploitation des informations.
En d'autres termes, le Big Data est composé de jeux de données complexes, provenant essentiellement de nouvelles sources. Ces ensembles de données sont si volumineux qu'un logiciel de traitement de données traditionnel ne peut tout simplement pas les gérer.
L'objectif de l'analytique Big Data est de mieux exploiter les ensembles volumineux de données dans le but de : Déceler des corrélations entre des informations, Identifier des schémas et tendances auparavant inconnus, Mieux comprendre les préférences des clients ou cibles.
Amazon, société de commerce en ligne, fait partie de ces structures qui font appel au Big Data pour orienter leur stratégie commerciale. Pour ce faire, elle stocke toutes les informations relatives à ses clients afin de définir leurs parcours d'achat et de voir leurs préférences.
La filière Big Data en a attiré plusieurs. Ces derniers se sont positionnés rapidement dans divers secteurs. Dans le secteur IT, on retrouve les fournisseurs historiques de solutions IT comme Oracle, HP, SAP ou encore IBM. Il y a aussi les acteurs du Web dont Google, Facebook, ou Twitter.
Le big data se caractérise par 5 aspects : volume, vitesse, variété, variabilité et véracité.
Volume, variété, vitesse, valeur – les « 4V »- sont les quatre critères définissant le phénomène Big data. Le Big data, c'est d'abord l'explosion du volume de données, qui met à l'épreuve les infrastructures de stockage classiques des entreprises.
Optimiser le traitement des données
Pour de nombreux experts, le traitement des données est l'un des enjeux les plus importants du Big Data. En effet, les informations arrivent en masse et se présentent sous divers formats.
L'un des avantages les plus importants du big data pour les entreprises est la réduction des coûts du stockage, du traitement et de l'analyse de données massives. Les outils de big data permettent aussi d'identifier des manières efficaces et plus économiques de faire des affaires.
Le volume des données explose. Dans un rapport de 2010 consacré au Big Data, McKinsey prédisait une augmentation de 60 % de la marge d'exploitation des retailers qui utiliseraient pleinement ces énormes volumes de données.
L'expression « Big data » fait finalement son apparition en octobre 1997 dans la bibliothèque numérique de l'ACM1, au sein d'articles scientifiques qui pointent du doigt les défis technologiques à visualiser les « grands ensembles de données ». Le Big data est né, et avec lui ses nombreux défis.
Il s'agit de la première caractéristique du Big Data, le volume (la quantité de données produites et disponibles). Il faut aussi que les données collectées répondent au critère de variétés. Les données sont de différents types : données structurées, données semi-structurées, données non structurées.
Les fournisseurs historiques de solutions IT tels que HP, Oracle, IBM ou SAP figurent parmi les principaux acteurs du Big Data. Ainsi, IBM propose depuis fin 2011 InfoSphere BigInsights Basic pour IBM SmartCloud Enterprise.
Entropie incontrôlée et infobésité Le big data est par sa définition même sujet à un autre danger intrinsèque majeur : le « déluge de données » (data deluge). Celui-ci correspond à une surproduction d'informations que l'on ne sait pas traiter correctement, ou sinon au détriment de leur véracité ou de leur valeur.
Par définition, le big data est un « domaine technologique dédié à l'analyse de très grands volumes de données informatiques ».
Quant à la liberté des individus, le Big Data n'entrave-il pas nos libertés ? La frontière entre les libertés individuelles et l'exploitation des données est assez étroite, et il s'avère délicat de tirer profit de ces données tout en respectant les libertés de chacun.
Data et expérience utilisateur
Netflix utilise la donnée pour améliorer l'expérience de ses utilisateurs. La plateforme retient parfaitement où vous vous êtes arrêtés, quel épisode et où à l'intérieur de l'épisode.
Grâce aux informations recueillies dans leurs bases de données, Netflix et Amazon, à titre d'exemple, identifient les tendances des et proposent aux usagers des produits répondant à leurs préférences. Ces données reflètent de manière notable nos orientations, notre mode de pensée et de consommation.