Reindexación de pandas

Reindexacion De Pandas



“En “pandas”, podemos almacenar mucha información en forma tabular, que también se conoce como DataFrame. Los “pandas” nos facilitan el método “DataFrame()” para construir el DataFrame. El DataFrame contiene índices, y también podemos cambiar los índices del DataFrame utilizando las funciones 'pandas'. El método que utilizamos para reindexar el DataFrame es el método “reindex()”. Este método ayuda a cambiar los valores de índice de la fila, así como los valores de índice de las columnas. Al utilizar este método, podemos cambiar el índice predeterminado del DataFrame y también podemos cambiar el índice que configuramos al crear el DataFrame. Usaremos el método 'reindex()' en nuestros ejemplos de 'pandas' en este tutorial y explicaremos este concepto en profundidad aquí'.

Ejemplo # 01

La herramienta 'Spyder' nos ayuda a desarrollar el código 'pandas' aquí en este tutorial, y comenzamos nuestro código con la palabra clave 'importar', que ayudará a importar la función 'pandas'. Colocamos 'pandas como pd' después de escribir 'importar'. Después de esto, creamos el DataFrame escribiendo “pd.DataFrame()”. Escribimos este 'pd' aquí porque el 'DataFrame()' es el método de 'pandas'. El “value_df” es el nombre de la variable en la que se guarda el DataFrame. Agregamos 'RandomName', que es el nombre de la columna, y 'RandomName' contiene 'Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander y Samuel'.







Luego, tenemos 'Valor_1', en el que hemos insertado '16, 29, 24, 35, 44, 50, 69, 74 y 88'. Luego viene 'Valor_2', y hemos agregado '25, 38, 42, 56, 54, 65, 78, 89 y 99'. Ahora, el 'Valor_3' viene a continuación, y colocamos '36, 48, 52, 69, 74, 75, 87, 91 y 69' en él. La columna 'Valor_4' está presente después de esto, donde hemos insertado '52, 64, 72, 88, 82, 95, 97, 21 y 39'. La última columna es la columna 'Valor_5' aquí, y en esta columna, los valores que hemos agregado son '66, 78, 82, 99, 34, 45, 57, 61 y 89'. Después de esto, usamos la función 'imprimir ()' en la que se agrega 'Values_df'. Se imprimirá en la terminal.




Después de presionar 'Shift + Enter', podemos obtener fácilmente el resultado de nuestros códigos en la aplicación 'Spyder'. Aquí, este código devuelve el DataFrame con el índice predeterminado. Ahora, aplicaremos el método “reindex()” para reindexar este DataFrame en “pandas”.




La función 'reindex()' se usa aquí para reindexar el valor de índice de la fila. En el DataFrame anterior, puede ver que se muestran los valores de índice predeterminados de la fila, y ahora, estamos aplicando el método 'reindex()' para reindexar esos índices de fila. Colocamos el nombre del DataFrame y luego el método 'reindex()' en el que colocamos los valores de índice que queremos agregar al DataFrame anterior. Ponemos “ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H e ind_I” en la función “reindex()”. Entonces, los índices de estas filas se actualizarán en el DataFrame cuando ejecutemos este código.






Los valores del índice de la fila se muestran en este resultado, y puede observar que los valores de DataFrame no se muestran aquí, y los valores 'NaN' han aparecido. Esto se debe a que los nuevos valores de índice no coinciden con los valores de índice anteriores del DataFrame. Cuando el índice nuevo y el índice antiguo no coinciden, muestra 'Nan' allí. Estos valores “NaN” aparecen por defecto cuando cambiamos el índice, y no coincide con el índice anterior.



Ejemplo # 02

Ahora estamos cambiando los valores de índice de columna del 'Valor_df', que hemos creado previamente en el ejemplo 1. Después de imprimir el 'Valor_df', colocamos la variable 'columna' y le agregamos algunos valores. Agregamos “a_1, b_1, c_1, d_1 y e_1”. Ahora, queremos ajustar estos valores como el índice de las columnas, entonces, para esto, estamos usando el método 'reindex()' y colocamos el nombre de la variable 'columna' en la que se almacenan los nuevos valores de índice de columna y también configure el 'eje' en 'columnas' para que actualice el índice del eje de la columna. Ponemos el método 'reindex ()' en 'print ()', por lo que también se mostrará en la terminal.


Como hemos utilizado el método 'reindex ()', los valores de índice de columna que están presentes en el primer DataFrame se actualizan y se agregan nuevos valores en el DataFrame actualizado. También puede notar que todos los valores del DataFrame se convierten a 'NaN' porque ambos valores de índice de las columnas son diferentes.

Ejemplo # 03

Los 'datos_de_programación' en este código contienen 'Lenguajes_P', donde hemos agregado 'JavaScript, CSS, ingeniería web, programación orientada a objetos, C#, IA, Java y JavaScript'. Luego, tenemos 'Horas' en las que colocamos '4_hrs, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs y 6_hrs'. Luego de esto se ingresa el “P_Code” e insertamos “11523, 12423, 12321, 11456, 11454, 12267, 13106, y 14123”. Añadimos la variable “p_index” y ponemos “Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G y Pro_H”.

Estos valores se utilizarán como valores de índice de las filas. Cambiamos los “Programming_data” en el DataFrame “Programming_df”. También agregamos el 'p_index' a este DataFrame usando el método 'index'. Ponemos “Programming_df” y luego el método “index” y le asignamos el “p_index” a este. Ahora, los valores de índice anteriores se agregan como valores de índice de filas al marco de datos. Imprimimos el “Programming_df” también.

Después de esto, agregamos algunos valores de índice nuevos en la variable 'nuevo_índice', y estos son 'P_1, P_2, P_3, P_4, P_5, P_6, P_7 y P_8'. Como queremos actualizar los valores de índice de las filas, usamos el método 'reindex ()' y colocamos 'new_index' como parámetro de esta función y también almacenamos el DataFrame actualizado en 'newProgramming_df' y colocamos 'newProgramming_df' en ' imprimir ()” para mostrar.


Los valores del índice se actualizan y también podemos decir que hemos reindexado el DataFrame que hemos creado. Todos los valores del DataFrame también se convierten a 'NaN' porque ambos valores de índice son diferentes.

Ejemplo # 04

Actualmente estamos modificando los valores de índice de columnas de 'Programming_df', que desarrollamos previamente en el ejemplo 3. Colocamos la variable 'columna' e insertamos nuevos valores en ella. El 'P_Code, P_Languages, Hours y New' se agregan a la variable 'columna'. Luego, nuevamente usamos el método 'reindex ()' en el que configuramos la variable 'columna', que actualizará los valores de índice de columna anteriores y agregará estos nuevos valores de índice de columna al DataFrame.

Aquí, puede notar que los nuevos valores que hemos agregado en 'columna' son los mismos que hemos agregado en el DataFrame anterior, pero la secuencia es diferente, por lo que cambiará la secuencia de las columnas y ajustará todas las columnas a medida que lo hagamos. mencionado en la variable “columna”. Además, agregamos un valor de índice más que no está presente en el DataFrame anterior, que es 'Nuevo' aquí, por lo que los valores 'NaN' aparecerán en esta columna.


La secuencia de las columnas se cambia aquí, y todos los valores aparecen tal como están presentes en las columnas del DataFrame original y la columna 'Nuevo' en el DataFrame actualizado contiene todos los valores 'NaN' porque esta columna no está presente en el DataFrame original.

Conclusión

Hemos presentado este tutorial que nos ayuda a comprender en detalle la noción de 'reindexación de pandas'. Hemos discutido cómo podemos reindexar la columna de un DataFrame, así como los valores de índice de la fila. Hemos explicado que la función “reindex()” de “pandas” se utiliza para hacer esto. Hemos hecho diferentes ejemplos en los que hemos cambiado los valores de índice de las filas del DataFrame y también los valores de índice del índice de la columna del DataFrame. Hemos presentado los resultados de todos los códigos que hemos hecho aquí en este tutorial y también los explicamos en profundidad.