Marco de datos de pandas único

La biblioteca de Python más popular que se utiliza en la ciencia de datos se llama Pandas. Ofrece a los programadores de Python herramientas de análisis de datos, fáciles de usar y de alto rendimiento. Una vez que comprenda las funciones fundamentales y cómo utilizarlas, Pandas es una potente herramienta para modificar datos. En 'pandas', los métodos estándar para almacenar datos en forma tabular son los DataFrames. Podemos utilizar algunos métodos de 'pandas' para obtener los valores únicos en la columna del marco de datos 'pandas'. Cuando necesitamos obtener valores únicos en las columnas del DataFrame y no queremos la duplicación de valores en la columna del DataFrame 'pandas', podemos usar los métodos que proporciona 'pandas' para hacer esto. Veamos estos métodos en esta guía, junto con algunos ejemplos y resultados para obtener valores únicos en la columna de 'pandas' de DataFrame.

Métodos para obtener valores únicos en las columnas del marco de datos 'pandas'

Podemos utilizar dos métodos para obtener los valores únicos en las columnas del marco de datos 'pandas'. Eliminamos los valores duplicados y solo obtenemos los valores únicos en las columnas de DataFrames. Los métodos que proporcionan los “pandas” para realizar esta tarea son:

Utilizando el método unique().
Utilizando el método drop_dupliactes().

Ahora, utilizaremos ambos métodos en los códigos 'pandas' para obtener los valores únicos en las columnas del marco de datos 'pandas'.

Ejemplo # 01

La aplicación 'Spyder' se utiliza aquí para generar estos códigos 'pandas' para utilizar esos métodos que nos ayudan a obtener los valores únicos en las columnas del marco de datos 'pandas'. Debemos importar los módulos “pandas”, que son necesarios para el código “pandas”, antes de crear el DataFrame. Al usar el término 'importar' y colocar 'pandas como pd', importamos estos módulos.

Ahora, con la ayuda de “pd”, podemos obtener rápidamente las funciones o métodos “pandas”. Luego ponemos 'Subject_data' en el que agregamos 'Nombre' y en 'Nombre', agregamos los datos del nombre que son 'Roman, William, Peter, Smith, John, Milli, Thomas y James'. Luego, agregamos los datos del tema en el 'Subj' que son 'Matemáticas, Economía, Ciencias, Matemáticas, Estadística, Estadística, Estadística e Informática'. Luego, convertimos estos 'Subject_data' en el DataFrame 'Subject_df' usando el método 'pd.DataFrame()'. Colocamos 'Subject_df' en el método 'print()' para que se muestre en la terminal.

Ahora, queremos obtener los valores únicos en la columna 'Subj' del marco de datos 'pandas'. Para este propósito, estamos usando el método 'único ()' aquí y agregamos el nombre de la columna y también el nombre del DataFrame como se muestra a continuación. Agregamos este método en 'imprimir ()' para que el resultado también se muestre en la terminal.

Ahora, estamos presionando 'Shift + Enter' para obtener el resultado de este código y se representa en la terminal y también se muestra aquí, que contiene el DataFrame con todos los valores. Este es el DataFrame original que hemos agregado en el código y debajo muestra los valores únicos de la columna 'Subj'. Suelta los valores duplicados y muestra los valores únicos de la columna 'Subj' del DataFrame.

Ejemplo # 02

Creamos la “Sample_list” que contiene alguna información. Insertamos 'Layla, 21, 28, 31, 14 y 39' que aparecerá como la primera columna cuando convertimos esta lista en el DataFrame. Luego, agregamos 'Lusy, 31, 25, 34, 26 y 21' como la segunda fila del DataFrame. Después de esto, tenemos 'Peter, 38, 20, 20, 35 y 24' y 'Layla 38, 23, 39 24, 23', que serán la tercera y cuarta fila del DataFrame. También insertamos tres datos más que son “Stella, 21, 24, 24, 28, 31”, “Layla, 33, 32, 26, 30, 25” y también “Peter, 21, 21, 31, 21, 29” .

Ahora, estamos convirtiendo 'Sample_list' en 'DF_Sample', que es el nombre del DataFrame aquí, colocando la función 'pd.DataFrame()'. Además, establecemos el nombre de las columnas de este DataFrame y estos nombres son 'Nombre, Ass_1, Ass_2, Ass_3, Ass_4 y Ass_5'. Luego, usamos 'print ()' que ayuda a mostrar el DataFrame 'DF_Sample'. Ahora, estamos usando otro método en este ejemplo para obtener los valores únicos en la columna de DataFrame. Este método es el método “drop_duplicates()” de “pandas”.

En el método “drop_duplicates()”, establecemos el nombre de la columna donde queremos obtener los valores únicos en la columna del DataFrame. Estamos obteniendo valores únicos de la columna 'Nombre' al soltar los valores duplicados en esta columna con la ayuda del método 'drop_duplicates()' y también representamos estos valores únicos usando la función 'print()' aquí.

Los nombres que están duplicados se descartan y los valores únicos se representan después de aplicar el método “drop_duplicates()”. Puede notar que el nombre 'Layla' aparece en tres celdas de la columna 'Nombre'. Pero cuando se aplica el método 'drop_duplicates()' a esta columna, todos los valores duplicados se eliminan y aparece un nombre 'Layla' en la pantalla. Después de eliminar los valores duplicados, apareció el nuevo DataFrame que contiene los valores únicos en esta columna 'Nombre'. De esta forma, podemos eliminar los valores duplicados y obtener el valor único en la columna de DataFrame con la ayuda del método “drop_duplicates()”.

Ejemplo # 03

El mismo DataFrame se utiliza nuevamente y ahora estamos aplicando el método 'único ()' aquí. Con el método “único()” colocamos el nombre de la columna así como el nombre del DataFrame en el que queremos aplicar este método “único()” para obtener los valores únicos. Esto solo representará los valores únicos de esa columna y no mostrará estos valores en forma de DataFrame.

Aquí, el DataFrame contiene siete valores en la columna 'Nombre', pero cuando aplicamos el método 'único ()' a esta columna, solo han aparecido cuatro valores y estos son los valores únicos de esa columna. No representa valores duplicados.

Ejemplo # 04

El DataFrame que creamos en este ejemplo es el 'F_G_df'. Insertamos 'My_fruits' y 'my_Vegs' en este DataFrame. La columna 'Mis_frutas' contiene 'Manzana, Naranja, Manzana, Pera, Lichi, Manzana, Manzana, Pera y Manzana'. A continuación, tenemos 'My_Vegs' que contiene los nombres de las verduras que son 'Chilli, Bringle, Carrot, Potato, Potato, Carrot, Onion, Garlic y Ginger'. Este DataFrame contiene solo dos columnas.

Ahora, obtenemos los valores únicos en ambas columnas con la ayuda del método 'único()'. Mencionamos el nombre del DataFrame. Luego, coloque el nombre de la primera columna de la columna. Después de esto, utilizamos el método append(). En este apéndice, colocamos nuevamente el nombre del DataFrame y el nombre de la segunda columna y colocamos el método 'único ()'. Esto obtendrá los valores únicos de ambas columnas y luego agregará los valores únicos de ambas columnas y aparecerán en la pantalla.

El DataFrame se representa primero y contiene todos los valores. Después de esto, se aplica el método 'único ()' y los valores únicos de ambas columnas se representan a continuación. En este código, obtenemos los valores únicos en las múltiples columnas del DataFrame usando el método 'único()'.

Conclusión

La explicación completa de cómo obtener los valores únicos en la columna de DataFrame se encuentra en esta guía. Hemos discutido los métodos 'único ()' y 'drop_duplicates ()' que nos ayudan a obtener los valores únicos de la columna de DataFrame. Hemos explorado cómo usar estos métodos en el código 'pandas' usando estos métodos aquí en nuestros códigos. Hemos ilustrado diferentes ejemplos en esta guía y le hemos mostrado cómo obtener los valores únicos de una columna usando el método 'único()' así como el método 'drop_duplicates()'. También hemos explorado cómo obtener los valores únicos en varias columnas utilizando el método 'único ()' en esta guía.

Marco de datos de pandas único

Métodos para obtener valores únicos en las columnas del marco de datos 'pandas'

Ejemplo # 01

Ejemplo # 02

Ejemplo # 03

Ejemplo # 04

Conclusión

Categoría

Entradas Populares

PySpark SelectExpr()

¿Qué es el cartógrafo de Minecraft? Profesión de los aldeanos

Cómo quitar el triángulo amarillo en la conexión de red en Windows 10

Solución: WiFi se detuvo automáticamente: error de código 10 de Intel AC 9560 en Windows

Cómo restablecer HEAD en Git

Cómo buscar una cadena en varios archivos y devolver los nombres de los archivos en PowerShell

Cómo conectarse a la base de datos MongoDB en AWS

Sensor LDR de interfaz con Arduino Nano

Cómo permitir ventanas emergentes en Google Chrome

Cómo reiniciar la red en Raspberry Pi

Cómo usar la función date_time_set() en PHP

¿Cómo volver a 'maestro' con Git?

Cómo ordenar Du por tamaño en Linux

¿Cómo activar acciones de GitHub flow_dispatch?

¿Cómo cambiar el sonido de la alarma en dispositivos Android?

¿Cómo utilizar el método stats.isDirectory() en Node.js?

Desviación estándar de pandas

¿Qué es el método 'clic ()' del elemento DOM en HTML?

Cómo solucionarlo: la instalación de Discord está dañada: error de Windows

¿Cómo forzar el cierre de Docker cuando se congela en Mac?