Limpiar el marco de datos en Pandas

Limpiar El Marco De Datos En Pandas



La eliminación de datos del Pandas DataFrame se realiza mediante la función pandas.DataFrame.drop(). Aparte de esta función, podemos seleccionar las filas del DataFrame sin considerar las columnas/filas. Esto también se puede hacer usando los corchetes. En esta guía, también utilizaremos la palabra clave 'del' y la función pop() para eliminar todas las filas iterando el DataFrame usando un bucle 'for'.

Usando Pandas.DataFrame.Drop

Usamos la función pandas.DataFrame.drop() para eliminar filas o columnas específicas del Pandas DataFrame. Usemos esta función para eliminar todas las filas y columnas.

Sintaxis :







La siguiente es la sintaxis de la función pandas.DataFrame.drop(). Utilizamos solo tres parámetros y analizamos solo estos tres en esta guía. Existe un tutorial detallado sobre esta función:



pandas. Marco de datos . gota ( etiquetas , eje , índice , columnas , nivel , en su lugar , errores )
  1. Necesitamos pasar una lista de índices de filas al parámetro 'etiquetas' para eliminar todas las filas del DataFrame. También podemos pasar el atributo DataFrame.index que selecciona todos los índices de filas. De manera similar, debemos pasar todos los nombres de las columnas a este parámetro o pasar la propiedad DataFrame.columns.
  2. Establezca el parámetro 'eje' en 1 si está pasando las columnas al parámetro 'etiquetas'. Por defecto, eje = 0 que hace referencia a las filas.
  3. Podemos realizar la operación (Eliminar) en el DataFrame existente. Establezca el parámetro 'in situ' en 'Verdadero'.

Ejemplo 1:

Considere el marco de datos 'Campaña1' con cuatro filas y dos columnas. Primero, elimine todas las filas pasando los índices de las filas al parámetro 'etiquetas' y luego elimine todas las columnas pasando las etiquetas de las columnas al parámetro 'etiquetas'.



importar pandas

# Crear DataFrame - Campaña1 con 2 columnas y 4 registros
Campaña1 = pandas. Marco de datos ( [ [ 'campamento java' , 'India' ] , [ 'campamento de Linux' , 'EE.UU' ] , [ 'campamento c/c++' , 'India' ] , [ 'campamento de pitón' , 'EE.UU' ] ] ,
columnas = [ 'Nombre de campaña' , 'Ubicación' ] )
imprimir ( Campaña1 , ' \norte ' )

# Eliminar todas las filas
Campaña1. gota ( etiquetas = [ 0 , 1 , 2 , 3 ] , en su lugar = Verdadero )
imprimir ( Campaña1 , ' \norte ' )

# Eliminar todas las columnas
Campaña1. gota ( etiquetas = [ 'Nombre de campaña' , 'Ubicación' ] , en su lugar = Verdadero , eje = 1 )
imprimir ( Campaña1 , ' \norte ' )

Producción :





Después de eliminar las filas, las filas se eliminan pero las columnas existen. Después de eliminar las columnas, 'Campaña1' está vacía.



Ejemplo 2:

Utilice el marco de datos 'Campaign1' anterior y elimine las filas pasando 'Campaign1.index' al parámetro 'labels' y luego elimine las columnas pasando 'Campaign.columns' al parámetro 'labels'.

importar pandas

# Crear DataFrame - Campaña1 con 2 columnas y 4 registros
Campaña1 = pandas. Marco de datos ( [ [ 'campamento java' , 'India' ] , [ 'campamento de Linux' , 'EE.UU' ] , [ 'campamento c/c++' , 'India' ] , [ 'campamento de pitón' , 'EE.UU' ] ] ,
columnas = [ 'Nombre de campaña' , 'Ubicación' ] )
imprimir ( Campaña1 , ' \norte ' )

# Eliminar todas las filas
Campaña1. gota ( etiquetas = Campaña1. índice , en su lugar = Verdadero )

# Eliminar todas las columnas
Campaña1. gota ( etiquetas = Campaña1. columnas , en su lugar = Verdadero , eje = 1 )
imprimir ( Campaña1 )

Producción :

Después de eliminar las filas, las filas se eliminan pero las columnas existen. Después de eliminar las columnas, 'Campaña1' está vacía.

Usando Iloc[]

La propiedad pandas.DataFrame.iloc[] se utiliza para seleccionar los datos según la posición del índice. Podemos utilizar esta propiedad para seleccionar 0 filas y 0 columnas del DataFrame. Aquí, no eliminaremos el DataFrame real, pero seleccionaremos 0 registros.

Sintaxis :

Primero, debemos eliminar las columnas y luego las filas.

  1. Seleccione 0 columnas – Marco de datos.iloc[:,0:0]
  2. Seleccione 0 filas – Marco de datos.iloc[0:0]

Ejemplo :

Utilice el mismo DataFrame y seleccione el DataFrame vacío usando la propiedad iloc[].

importar pandas

# Crear DataFrame - Campaña1 con 2 columnas y 4 registros
Campaña1 = pandas. Marco de datos ( [ [ 'campamento java' , 'India' ] , [ 'campamento de Linux' , 'EE.UU' ] , [ 'campamento c/c++' , 'India' ] , [ 'campamento de pitón' , 'EE.UU' ] ] ,
columnas = [ 'Nombre de campaña' , 'Ubicación' ] )
imprimir ( Campaña1 , ' \norte ' )

# Eliminar todas las filas
Campaña1. gota ( etiquetas = [ 0 , 1 , 2 , 3 ] , en su lugar = Verdadero )
imprimir ( Campaña1 , ' \norte ' )

# Eliminar todas las columnas
Campaña1. gota ( etiquetas = [ 'Nombre de campaña' , 'Ubicación' ] , en su lugar = Verdadero , eje = 1 )
imprimir ( Campaña1 , ' \norte ' )

Producción :

Usando la palabra clave Del

Todos los datos se eliminarán del DataFrame usando la palabra clave 'del' iterando todas las filas dentro del bucle 'for'.

importar pandas

# Crear DataFrame - Campaña1 con 4 columnas y 4 registros
Campaña1 = pandas. Marco de datos ( [ [ 'campamento java' , 'India' ] , [ 'campamento de Linux' , 'EE.UU' ] , [ 'campamento c/c++' , 'India' ] , [ 'campamento de pitón' , 'EE.UU' ] ] ,
columnas = [ 'Nombre de campaña' , 'Ubicación' ] )
imprimir ( Campaña1 , ' \norte ' )

# Usando la palabra clave del
para i en Campaña1:
  del Campaña1 [ i ]
imprimir ( Campaña1 )

Producción :

Ahora, el DataFrame está vacío.

Usando la función Pop()

Todos los datos se eliminarán del DataFrame usando la función pop() iterando todas las filas dentro del bucle 'for'. Esta función se especifica dentro del bucle 'for'.

importar pandas

# Crear DataFrame - Campaña1 con 4 columnas y 4 registros
Campaña1 = pandas. Marco de datos ( [ [ 'campamento java' , 'India' ] , [ 'campamento de Linux' , 'EE.UU' ] , [ 'campamento c/c++' , 'India' ] , [ 'campamento de pitón' , 'EE.UU' ] ] ,
columnas = [ 'Nombre de campaña' , 'Ubicación' ] )
imprimir ( Campaña1 , ' \norte ' )

# Usando pop()
para i en Campaña1:
Campaña1. estallido ( i )
imprimir ( Campaña1 )

Producción :

Ahora, el DataFrame está vacío.

Conclusión

Aprendimos cómo borrar el Pandas DataFrame eliminando las filas y columnas. Primero, eliminamos filas del DataFrame usando la función drop() y luego eliminamos las columnas después de utilizar la propiedad iloc[] para seleccionar 0 filas. Por último, analizamos cómo eliminar los registros del DataFrame usando la palabra clave 'del' y la función pop().