Il est possible également de transformer plusieurs colonnes ou toutes les colonnes d'un dataframe en accompagnant la méthode « to_numeric » avec la méthode « apply() »: Cette fonction tentera de transformer des objets non numériques tels que des chaînes en entiers ou en nombre à virgule flottante.
Par défaut si l'on a une DataFrame avec trop de colonnes, l'affichage de tous les noms de colonnes sera tronqué. Il faut faire une manipulation supplémentaire pour afficher tous les noms de colonnes. Pour obtenir les colonnes d'une DataFrame, on peut utiliser l'attribut "columns".
Renommez une colonne
rename . On peut ainsi renommer une ou plusieurs colonnes via la syntaxe : mon_dataframe. rename(columns={'ancien nom': 'nouveau nom'}) .
La fonction colnames() permet de renommer le nom des colonnes d'un dataframe .
Une autre façon de renommer les colonnes dans un DataFrame Pandas consiste à utiliser la méthode set_axis . C'est une méthode flexible et pratique qui peut être utilisée pour renommer les colonnes en sélectionnant leur indice ou leur étiquette.
Pour créer une nouvelle colonne dans votre dataframe, il existe plusieurs solutions. La fonction "assign()" permet notamment de créer une nouvelle colonne. Vous pouvez utiliser une colonne de votre dataframe en paramètre. Une simple assignation de la nouvelle colonne permet également de la créer.
Une autre façon d'insérer une nouvelle colonne dans un DataFrame Pandas est d'utiliser la méthode insert . La méthode insert prend trois arguments : loc , column et value . loc est l'indice de la colonne où nous voulons insérer la nouvelle colonne.
Les variables en Python sont des références nommées
En Python, tout est objet. Comme Python est un langage fortement typé, chaque objet à un type et ce type ne peut pas changer.
La méthode la plus simple pour supprimer une colonne d'un DataFrame consiste à utiliser la méthode drop . Vous pouvez utiliser la méthode drop avec le paramètre axis=1 pour indiquer que vous souhaitez supprimer une colonne.
Pour obtenir le type d'une variable en Python, vous pouvez utiliser la fonction intégrée type() . En Python, tout est un objet. Ainsi, lorsque vous utilisez la fonction type() pour afficher le type de la valeur stockée dans une variable sur la console, elle renvoie le type de la classe de l'objet.
reset_index(drop = True, inplace = True) : modifie le dataframe directement. Pour un dataframe qui a une colonne 'A' : df. set_index('A') renvoie un dataframe où l'index est la colonne A et la colonne A a disparu du dataframe lui-même.
Pour supprimer des lignes en fonction de certaines conditions, sélectionnez l'index des lignes qui remplissent la condition spécifique et transmettez cet index à la méthode drop() . Dans ce code, (df['Unit_Price'] >400) & (df['Unit_Price'] < 600) est la condition pour supprimer les lignes.
La Dataframe est une structure de données qui organise les données en lignes et en colonnes, ce qui en fait une structure de données bidimensionnelle. Vous pouvez l'imaginer comme une feuille de calcul ou une table SQL, ou encore un dictionnaire d'objets Series. C'est généralement l'objet pandas le plus utilisé.
Modifier une variable globale depuis une fonction
Pour faire cela, il suffit d'utiliser le mot clef global devant le nom d'une variable globale utilisée localement afin d'indiquer à Python qu'on souhaite bien modifier le contenu de la variable globale et non pas créer une variable locale de même nom.
Le type float (flottant)
Ce type est utilisé pour stocker des nombres à virgule flottante, désignés en anglais par l'expression floating point numbers. Pour cette raison, on appelle ce type : float .
Pour affecter une valeur à une variable, c'est-à-dire l'initialiser ou modifier sa valeur, on utilise l'opérateur d'affectation ( = ). À gauche de l'opérateur on retrouve le nom de la variable et à droite la valeur qu'on souhaite lui affecter. Pour accéder au contenu d'une variable, il suffit d'utiliser son nom.
La fonction tolist() est une méthode intégrée dans Pandas qui convertit un DataFrame en liste. Vous appelez simplement cette fonction sur votre DataFrame et elle renvoie une liste. Comme vous pouvez le voir, la fonction tolist() renvoie une liste de listes, où chaque liste interne correspond à une ligne du DataFrame.
Pour créer une DataFrame avec des colonnes vides, il faut utiliser le paramètre "colums" dans le constructeur de la DataFrame. On peut alors indiquer une série contenant les colonnes désignées par leurs intitulés. Il est également possible d'utiliser des index plutôt que des colonnes pour contenir les données.
pour renommer une colonne il suffit d'utiliser la fonction names(). names(data) renvoie le nom des colonnes d'une data. frame sous la forme d'un vecteur. names(data)[5] est le nom de la 5ème colonne.
Ajouter une colonne de 1 à une matrice 1D
On peut utiliser la fonction numpy concatenate: >>> Y_new = np. concatenate([np. ones(1),Y_new]) >>> Y_new array([ 1., 11., 64., 20.])
Afficher un échantillon du dataframe
On se contentera d'afficher juste un sous ensemble du dataframe en utilisant la fonction head (ou tail par symétrie). df_paris. head() par défaut retourne les 5 premières lignes.