Data.gouv.fr est la plateforme des données publiques du gouvernement. C'est la première source open data de France. Elle est développée par la mission Etalab depuis son ouverture en 2011. C'est une référence en termes d'open data avec près de 38 000 jeux de données mis à disposition.
L'open data désigne un mouvement, né en Grande-Bretagne et aux États-Unis, d'ouverture et de mise à disposition des données produites et collectées par les services publics (administrations, collectivités locales...).
Administration locale (France)
La loi pour une République numérique de 2016 oblige toutes les collectivités territoriales de plus de 3500 habitants ou 50 agents à publier les données produites dans le cadre de leurs missions de service public.
Etalab coordonne la politique d'ouverture et de partage des données publiques (open data) : Il coordonne les actions des administrations de l'Etat et leur apporte son appui pour faciliter la diffusion et la réutilisation de leurs informations publiques.
Certaines entreprises possèdent leur propre centre de traitement de données en interne. C'est par exemple le cas de très grandes sociétés comme Facebook (data center basé à Prineville en Oregon), Amazon (dans l'Oregon également), Microsoft, Twitter,…
Tous les secteurs d'activité recherchent ces ingénieurs de la donnée. Leur rôle : la collecte, le stockage et l'exploitation de cette masse d'informations. Le data engineer travaille de pair avec le data analyst, qui agrège les données, et le data scientist, qui exploite les plus complexes d'entre elles.
Les Data Brokers ont pour but de collecter des données sur le comportement et les habitudes de consommation des utilisateurs. Pour cela, elles peuvent s'allier à des plateformes telles que Facebook et récupérer des informations sur les personnes y étant inscrites.
Le département Etalab de la Direction interministérielle du numérique est chargé de la mise en oeuvre et de la gouvernance de ce service public.
Producteurs de données
Ce sont les organismes qui recherchent les données sur l'état de santé et de bien-être social des populations, le système de santé et son fonctionnement (structures, professionnels, dépenses, accès aux soins…), les problèmes de santé, etc.
Aujourd'hui, le consommateur est devenu le point focal de la collecte et l'exploitation des données. Des géants comme Google ou Facebook dominent le marché de la publicité ciblée et engrangent des milliards de dollars, notamment grâce à l'émergence des technologies dites de « Big Data ».
Google est suivi de Twitter qui récolte 24 types de données personnelles, puis d'Amazon juste derrière avec 22 types de données personnelles récoltées. Les deux meilleurs du classement sont Facebook (14) et Apple (12) qui collectent donc le moins de données parmi les géants de la tech.
Ces data centers sont gérés par un fournisseur de services managés, ou MSP, pour le compte de ses clients. L'avantage, c'est que les entreprises n'ont pas à acheter d'équipements, ni à en assurer la maintenance : le prestataire informatique s'occupe de tout.
Selon plusieurs sources, la région française d'AWS qui compte trois zones de disponibilité se répartit entre le data center d'Interxion à La Courneuve, le DC3 de Scaleway à Vitry-sur-Seine et les centres de données de Data4 à Paris-Saclay.
Tous les équipements au sein d'un Data Center sont alimentés à l'électricité. L'utilisation de cette énergie fait naître de l'énergie calorifique. Et celle-ci doit être éliminée de l'ensemble de la structure (du bâtiment) au moyen du refroidissement, nécessitant aussi de l'énergie électrique.
Parmi les endroits où vous pouvez vendre vos données, citons Azure Data Market de Microsoft, Salesforce, InfoChimps et DataMarket.
Qui achète ces données ? Outre des agences publicitaires et des partis politiques qui achètent ces données pour vous envoyer des messages politiques, d'autres acheteurs cherchent à acheter les données qui vous concernent, vous en particulier.
Le RGPD et la CNIL sont des éléments structurant le respect des données personnelles. Le RGPD est le Règlement Général sur la Protection des Données, et la CNIL est l'unité qui contrôle ce règlement.
L'entreprise qui réalise des traitements de données et les sous-traitants doivent désigner un délégué à la protection des données (DPO) dans les cas suivants : Leur activité fait partie du secteur public. Leur activité principale amène un suivi régulier et systématique de personnes à grande échelle.
En systématisant l'échange et le partage de données entre services et entre collectivités, l'open data réduit les délais d'accès et de traitement des informations, augmente l'efficacité des processus et au final, améliore le service public.
Les open data, ou « données ouvertes », sont des données accessibles et exploitables par n'importe quel utilisateur, sans restriction technique ou juridique. Elles contribuent aussi bien à la vie démocratique d'un pays qu'au management des savoirs scientifiques, technologiques, culturels et environnementaux.
Les limites de l'Open Data et de la logique de stock
Deux raisons à cela. Tout d'abord les plateformes anonymes publiques ou privées sur lesquelles tout un chacun peut exposer ou récupérer des données posent la question de la qualité des informations mises à disposition.
Essonne : la construction du plus grand data center de France a commencé Construit à l'initiative de CloudHQ dans la ZAC Léonard de Vinci à Lisses (Essonne), ce centre de données comprendra 48 salles informatiques réparties sur une surface de 66 000 m².