Descripteur : mot ou un groupe de mots choisi pour caractériser les informations contenues dans un document et pour faciliter les recherches.
Il s'agit d'une liste d' « objets » qui sont ici des personnes et on peut les décrire grâce à des « descripteurs » (ou « champs ») : nom, prénom, adresse, numéro de téléphone.
Notions de données structurées / non structurées
Une donnée est une valeur (numérique ou textuelle) représentant une information. Pour pouvoir utiliser cette donnée d'un point de vue informatique, il va être utile de la "structurer".
Distinguer la valeur d'une donnée de son descripteur. Utiliser un site de données ouvertes, pour sélectionner et récupérer des données. Réaliser des opérations de recherche, filtre, tri ou calcul sur une ou plusieurs tables. Retrouver les métadonnées d'un fichier personnel.
"nom", "prenom" et "date_naissance" sont appelés des descripteurs alors que, par exemple, "Durand", "Dupont" et "Terta" sont les valeurs du descripteur "nom".
Pour retrouver les différents termes (descripteurs ou mots-clés) associés à chacun des concepts de la question initiale, il faut utiliser un maximum d'outils. Les outils les plus courants sont les dictionnaires et les encyclopédies (générales ou thématiques).
En CSV, les données sont stockées dans un fichier texte : où la première ligne donne la liste des descripteurs, , où chaque autre ligne du tableau correspond à un objet, où les valeurs (d'un objet) sont séparées par une virgule.
Un descripteur d'application est une balise d'application qui mappe un système informatique, un serveur d'applications ou un module à une application métier. Les descripteurs d'application vous permettent d'identifier un composant d'une application métier au stade du développement.
Pour cela, deux approches différentes sont proposées. Une première qui consiste à utiliser exclusivement un outil de type tableur et des outils de géolocalisation disponibles sur Internet et une seconde qui consiste à obtenir les mêmes résultats à partir de l'exploitation d'un programme en langage Python.
On parle depuis quelques années du phénomène de big data , que l'on traduit souvent par « données massives ». Avec le développement des nouvelles technologies, d'internet et des réseaux sociaux ces vingt dernières années, la production de données numériques a été de plus en plus nombreuse : textes, photos, vidéos, etc.
Les données peuvent être divisées en 2 grandes catégories. Catégoriques et quantitatives. Les données catégories peuvent être subdivisées en données nominales et ordinales. Les données quantitatives peuvent être discrète ou continue et sont aussi appelées données numériques.
Les informations sont des « données transformées ».
Une information représente 'l'output' du processus d'analyse. Une ou plusieurs données auront été analysées et auront suivi un processus résultant en une information.
Quels objectifs ? Cet enseignement de culture générale à destination de tous les élèves de la classe de Seconde, doit permettre : d'appréhender les principaux concepts des sciences numériques. de comprendre le poids croissant du numérique et les enjeux qui en découlent.
Pour pouvoir être exploitées par l'environnement de Business Intelligence de l'entreprise, ces données doivent être préparées: structuration, déduplication et plus généralement « nettoyage ».
Par exemple : un nom, une photo, une empreinte, une adresse postale, une adresse mail, un numéro de téléphone, un numéro de sécurité sociale, un matricule interne, une adresse IP, un identifiant de connexion informatique, un enregistrement vocal, etc.
Les descripteurs sont des variables qui ne sont pas en rapport avec une référence connue. On ne peut pas définir de seuils et donc aucun état ne peut être attribué.
Il suffit de sélectionner « Données » puis « Trier… » et de choisir un descripteur. On peut choisir un tri dans l'ordre croissant ou décroissant. On peut même choisir d'autres descripteurs pour effectuer un tri dans un tri !
Un traitement facile par les algorithmes de machine learning : Le principal avantage des données structurées est leur facilité de traitement par le machine learning. La nature précise et organisée des données structurées permet de manipuler et interroger ces dernières facilement.
"nom", "prenom" et "date_naissance" sont appelés des descripteurs alors que, par exemple, "Durand", "Dupont" et "Terta" sont les valeurs du descripteur "nom".
Un fichier CSV (Valeurs séparées par une virgule) est un fichier texte dont le format spécifique permet d'enregistrer les données structurées sous forme de tableau.