Comme son nom l'indique, la fonction rename() permet de renommer les variables d'un data frame.
Activez la fenêtre de l'éditeur de données. Double-cliquez sur un nom de variable dans la zone supérieure de la colonne dans Vue de données ou cliquez sur l'onglet Vue de variable. Entrez le nom de la nouvelle variable dans la cellule Nom de la variable.
pour renommer une colonne il suffit d'utiliser la fonction names(). names(data) renvoie le nom des colonnes d'une data. frame sous la forme d'un vecteur. names(data)[5] est le nom de la 5ème colonne.
Si on souhaite recoder une modalité de la variable en NA , il faut (contre intuitivement) lui assigner la valeur NULL . À l'inverse, si on souhaite recoder les NA d'une variable, on utilisera la fonction fct_explicit_na , qui convertit toutes les valeurs manquantes ( NA ) d'un facteur en une modalité spécifique.
Afin de faciliter l'analyse, il vous faudra peut-être recoder certaines variables spécifiques pour qu'elles correspondent à vos besoins d'analyse. Disons par exemple que vous voulez analyser une réponse spécifique à votre enquête par rapport à l'âge des répondants.
Celle-ci prend en premier argument un vecteur, puis une série de recodages sous la forme Nouvelle valeur = Ancienne valeur . À noter que toutes ces opérations sont sensibles à la casse (majuscules/minuscules), aux accents, aux espaces, etc. Il faut donc recopier exactement à l'identique les noms des anciennes valeurs.
Sélectionnez une colonne, puis sélectionnez Transformer> Renommer. Vous pouvez également double-cliquer sur l'en-tête de colonne. Entrez le nouveau nom.
Modifier les noms de lignes
Par défaut, R propose de numéroter les lignes de notre data frame. Mais nous pouvons également nommer les lignes tout comme on peut nommer les éléments d'un vecteur. Pour cela, il suffit d'utiliser la fonction row.
La fonction colnames() permet de renommer le nom des colonnes d'un dataframe .
Les variables définies dans une fonction sont appelées variables locales. Elles ne peuvent être utilisées que localement c'est-à-dire qu'à l'intérieur de la fonction qui les a définies. Tenter d'appeler une variable locale depuis l'extérieur de la fonction qui l'a définie provoquera une erreur.
Pour créer une nouvelle variable, il suffit d'assigner des valeurs à une variable dont le nom n'existe pas encore dans le tableau. Si l'utilisateur assigne des valeurs à une variable dont le nom existe déjà dans le tableau, les valeurs originelles seront écrasées par les nouvelles valeurs.
Chaque nom de variable doit être unique ; aucune duplication n'est admise. Les noms de variable peuvent contenir jusqu'à 64 octets, le premier caractère étant une lettre ou l'un des caractères suivants : @, # ou $. Les caractères suivants peuvent être une combinaison de lettres, de chiffres, un point (.)
5.3.2 Quantitatif à qualitatif
Si une variable numérique contient en réalité un petit nombre de valeurs différentes, il suffit de convertir la classe de l'objet de numeric vers factor ou ordered pour que R comprenne que la variable doit être traitée comme une variable qualitative.
En R, un facteur (factor, en anglais) est un vecteur dont les éléments ne peuvent prendre que des modalités prédéfinies. Ce qui caractérise un facteur en R est le fait qu'elle dispose de l'attribut Levels (niveaux).
Comment sélectionner une colonne ou une ligne dans un jeu de donnée avec R ? Pour sélectionner une colonne ou une ligne on peut utiliser son rang ( 1er colonne, 2eme colonne…). Si on ne sélectionne qu'une seule ligne ou colonne, cela ressort un object de classe vector.
Pour créer un data frame, nous allons commencer par créer les vecteurs qui constitueront les colonnes de notre future data frame. Maintenant il suffit d'utiliser la fonction data. frame() pour construire notre data frame. Les colonnes d'un data frame sont toujours nommées.
Comment rajouter des lignes ou des colonnes dans des jeux de données sous R ? : cbind, rbind. Lorsque l'on manipule des jeux de données on est souvent amené à vouloir rajouter des colonnes, rajouter des lignes concaténer des jeux de données… Pour rajouter des colonnes, il faut utiliser la fonction cbind.
Sous l'onglet Formules, dans le groupe Noms définis, cliquez sur Gestionnaire de noms. Dans la boîte de dialogue Gestionnaire de noms, double-cliquez sur le nom que vous souhaitez modifier, ou cliquez sur le nom à modifier, puis cliquez sur Modifier.
Renommer une colonne à l'aide de l'Explorateur d'objets
Dans l'Explorateur d'objets, cliquez avec le bouton droit sur la table dans laquelle vous souhaitez renommer des colonnes et choisissez Renommer. Tapez une nouvelle colonne.
Deux grands types sont distingués : les variables quantitatives, sur lesquelles des résumés numériques peuvent être calculés (âge pour des individus, population pour des communes) ; les variables qualitatives, qui regroupent les individus dans un nombre fini de modalités (sexe pour des individus, département d' ...
1.2.1 Pour afficher les modalités
Ces modalités (ou levels) sont affichées dans la sortie de la fonction str , mais il est parfois plus pratique d'utiliser la fonction levels , qui n'affichera que cette information.
Variables quantitatives
Une variable quantitative peut être continue ou discontinue. Les variables quantitatives discontinues (ou discrètes) correspondent aux données de dénombrement ; les résultats s'expriment donc sous la forme d'un entier positif (ou nul). Il s'agit par exemple du nombre d'enfants.