La méthode pour renommer une colonne est . rename . On peut ainsi renommer une ou plusieurs colonnes via la syntaxe : mon_dataframe. rename(columns={'ancien nom': 'nouveau nom'}) .
Par défaut si l'on a une DataFrame avec trop de colonnes, l'affichage de tous les noms de colonnes sera tronqué. Il faut faire une manipulation supplémentaire pour afficher tous les noms de colonnes. Pour obtenir les colonnes d'une DataFrame, on peut utiliser l'attribut "columns".
Il est possible également de transformer plusieurs colonnes ou toutes les colonnes d'un dataframe en accompagnant la méthode « to_numeric » avec la méthode « apply() »: Cette fonction tentera de transformer des objets non numériques tels que des chaînes en entiers ou en nombre à virgule flottante.
Pour créer une DataFrame avec des colonnes vides, il faut utiliser le paramètre "colums" dans le constructeur de la DataFrame. On peut alors indiquer une série contenant les colonnes désignées par leurs intitulés. Il est également possible d'utiliser des index plutôt que des colonnes pour contenir les données.
Cela peut être fait en utilisant la méthode DataFrame. replace() . Il est utilisé pour remplacer une expression régulière, une string, une liste, une série, un nombre, un dictionnaire, etc. à partir d'un DataFrame.
La fonction "assign()" permet notamment de créer une nouvelle colonne. Vous pouvez utiliser une colonne de votre dataframe en paramètre. Une simple assignation de la nouvelle colonne permet également de la créer. Si vous ne voulez modifier qu'une valeur précise, vous pouvez utiliser la méthode "loc()".
# 2 – La fonction apply
C'est l'une des principales fonctions pour jouer avec les données et créer de nouvelles variables. apply retourne une valeur après avoir passé chaque ligne / colonne d'un DataFRame avec une fonction. La fonction peut être une fonction par défaut ou alors définie par l'utilisateur.
La méthode la plus simple pour supprimer une colonne d'un DataFrame consiste à utiliser la méthode drop . Vous pouvez utiliser la méthode drop avec le paramètre axis=1 pour indiquer que vous souhaitez supprimer une colonne.
Une autre façon de renommer les colonnes dans un DataFrame Pandas consiste à utiliser la méthode set_axis . C'est une méthode flexible et pratique qui peut être utilisée pour renommer les colonnes en sélectionnant leur indice ou leur étiquette.
Les variables en Python sont des références nommées
En Python, tout est objet. Comme Python est un langage fortement typé, chaque objet à un type et ce type ne peut pas changer.
"Renommer une variable" est impossible. Mais tu peux créer des variables qui possèdent des "sous-variables" (propriétés), par exemple une variable utilisateur qui possèderait des propriétés Nom, Prenom et Surnom.
Depuis Python 3.0 il est possible de préciser le type d'une variable lors de sa déclaration. Pour spécifier le type d'une variable, il faut ajouter un : suivit du nom du type entre le nom de la variable et le caractère = .
Utiliser return pour retourner plusieurs valeurs
Pour cela, on va préciser les différentes valeurs que doit retourner return en les séparant par des virgules. Les valeurs retournées seront retournées dans un tuple.
Pour créer une variable en Python, on va donc devoir choisir un nom et affecter une valeur à ce nom, c'est-à-dire stocker une valeur dans notre variable. Le choix du nom pour nos variables est libre en Python.
Une autre façon d'insérer une nouvelle colonne dans un DataFrame Pandas est d'utiliser la méthode insert . La méthode insert prend trois arguments : loc , column et value . loc est l'indice de la colonne où nous voulons insérer la nouvelle colonne.
La fonction append() dans Pandas DataFrame est utilisée pour ajouter des lignes d'autres objets DataFrame à la fin du DataFrame donné, renvoyant ainsi un nouvel objet DataFrame. Elle ne modifie pas le DataFrame original; à la place, un nouveau est créé qui inclut les données originales et ajoutées.
La fonction Pandas permettant de faire une concaténation est la fonction concat . Pour concaténer plusieurs data frames, il suffit de placer l'ensemble de ceux-ci dans une liste, et d'utiliser la fonction concat sur cette liste. Le souci d'une concaténation, c'est qu'elle ne gère pas du tout les index par défaut.
Il y a trois façons de remplacer un élément dans une liste Python. Vous pouvez utiliser l'indexation de la liste ou une boucle for pour remplacer un élément. Si vous voulez créer une nouvelle liste basée sur une liste existante et y apporter une modification, vous pouvez utiliser une compréhension de liste.
Un moyen très courant de remplacer les valeurs manquantes consiste à utiliser la médiane. Ce ne sont que des méthodes très simples pour remplacer les valeurs manquantes, mais assurez-vous de consulter la page de Matt pour connaître les techniques appropriées dans chaque cas.
Remplacer les valeur NaN en python
Avec les librairies, vous aurez deux solutions afin de remplacer les valeurs Nan par des 0: soit fillna() — avec la librairie pandas—, soit replace() —avec la librairie numpy—voyons ensemble quelques exemples.