Columna de suma de pandas

Columna De Suma De Pandas



“Este artículo demostrará cómo sumar todas las columnas o columnas particulares en un DataFrame de Pandas usando Python. La función DataFrame.sum() se usará junto con algunos parámetros útiles en los numerosos ejemplos de este tutorial”.

Cuando termine este tutorial, es posible que sepa cómo:







    • Encuentre la suma de la columna del marco de datos en Pandas.
    • Agregar las columnas del marco de datos juntas
    • Agregue columnas a un marco de datos de Pandas que cumpla con la condición especificada.
    • Determine la suma después de agrupar los datos del marco de datos.

¿Cómo determinar la suma de las columnas del marco de datos?

La función 'dataframe.sum()' en Pandas devuelve la suma total para el eje especificado. Si la entrada es un eje del índice, la función agrega los valores de cada columna individualmente, luego hace lo mismo para cada columna, devolviendo una serie que almacena la suma de los datos/valores en cada columna. Además, admite el cálculo de la suma del marco de datos ignorando los valores faltantes.



Sintaxis: DataFrame.sum(axis = Ninguno, skipna = Ninguno, nivel = Ninguno, numeric_only = Ninguno, min_count = 0, **kwargs)



Dónde,





eje: {columnas (1), índice (0)}

ordenar: Ignore los valores NA/null al calcular el resultado.



nivel: Si el eje especificado es jerárquico (un índice múltiple), cuente hasta un nivel de índice particular antes de convertirlo en Serie.

solo numérico: Solo se aceptan columnas flotantes, int y booleanas. Si ninguno, intente usar todo; si no, sólo datos numéricos. Para Serie, no implementado.

min_count: El número de valores posibles requeridos para completar la operación. El resultado será NA si hay menos valores que no sean NA presentes que min_count.

Devoluciones: DataFrame (si se especifica el nivel) o Serie.

Ejemplo # 01: Determinar la suma de una columna de marco de datos y todas las columnas

Primero hemos requerido un marco de datos con los tipos de datos válidos, es decir, int, float, etc., columna o columnas para las que podemos encontrar la suma de datos. El marco de datos se creará utilizando la función pd.DataFrame().


Hemos creado el marco de datos requerido a partir de un diccionario de python dentro de la función pd.DataFrame(). En el marco de datos creado anteriormente, hay cuatro columnas 'Nombre', 'día1', 'día2' y 'día3'. De cuatro columnas, las tres columnas, es decir, 'día1', 'día2' y 'día3' son columnas numéricas con los valores de datos (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, 5, 2, 3, 4, 6, 2) y (7, 4, 3, 5, 6, 2, 1, 4) respectivamente. Solo podemos encontrar la suma de estas tres columnas. La suma de ambas series (es decir, una columna) y un marco de datos completo se puede determinar utilizando el método sum(). Comencemos enseñando cómo sumar todos los datos en una columna de Pandas.


Para determinar la suma, usamos el método sum() en la columna 'día2'. La función ha devuelto el valor de suma de 28. Similar a esto, podemos determinar la suma de cada columna de Dataframe. Simplemente usando el método sum() en todo el marco de datos se logrará esto.


Como se puede observar, la suma de la columna “día1” es 31; para “día2”, el valor de la suma es 28, mientras que para la columna “día3”, el valor de la suma es 32.

Ejemplo # 02: Uso de la función sum() para sumar los valores de la columna del marco de datos juntos

Como puede ver en el resultado del ejemplo anterior, la función no devolvió los datos reales de la columna del marco de datos que componían la suma. Sin embargo, al asignar el método 'DataFrame.sum()' a una columna de DataFrame, puede acceder a todas las columnas de DataFrame, incluida la columna de suma. Primero, creamos otro marco de datos para este ejemplo.


Usando pd.DataFrame(), se ha creado nuestro marco de datos. Hemos creado el marco de datos con tres columnas: artículo, precio e impuesto. El elemento de la columna que contiene los valores de cadena ('bolígrafo', 'marcador', 'regla', 'borrador', 'lápiz', 'portapapeles', 'grapadora', 'alfileres'), el precio de la columna que almacena los valores (20, 15, 10, 3, 5, 30, 35, 10), y la columna 'impuesto' consta de valores (8, 5, 3, 3, 4, 10, 5, 2). Ahora agreguemos los valores de las columnas de precio e impuestos y almacenemos los resultados en una nueva columna manteniendo las columnas del marco de datos original.


Como se puede notar junto con la nueva columna 'total', la función también devuelve las columnas originales del marco de datos dado. La columna 'total' almacena la suma de los valores de las columnas 'precio' e 'impuesto' contra cada dato de 'artículo'.

Ejemplo # 03: Uso de la función sum() para determinar la suma de las columnas del marco de datos especificado

Para sumar las múltiples columnas del marco de datos, podemos especificar una lista con las etiquetas de las columnas y luego aplicar el método sum() en la lista para encontrar la suma. Como en los ejemplos anteriores, primero crearemos el marco de datos.


Hemos creado nuestro marco de datos con cuatro columnas 'estudiantes', 'marcas1', 'marcas2' y 'marcas3'. La columna 'estudiantes' almacena los datos ('Larry', 'James', 'Rob', 'Arya', 'Max', 'Ben', 'Gwen', 'Bill') y la columna 'marks1' almacena los (8, 9, 6, 8, 10, 7, 9, 9), mientras que las columnas 'marks2' y 'marks3' almacenan los valores numéricos (6, 6, 8, 6, 7, 9, 10, 9 ) y (7, 6, 9, 7, 8, 7, 10, 10) respectivamente.


Primero, hemos creado un objeto de lista con etiquetas de columna 'estudiantes', 'marcas1' y 'marcas3'. Luego se aplica el método sum() a la lista. La función ha sumado los valores de las columnas marcas1 y notas3 solo porque la columna 'estudiantes' no es numérica, por lo que la función sum() no puede encontrar la suma de los valores de la columna 'estudiantes'. Hemos almacenado la suma de los valores de las columnas 'marcas1' y 'marcas3' en la columna 'suma'.

Ejemplo n.° 04: agregue columnas de marco de datos de Pandas que satisfagan una condición específica

En este ejemplo, agregaremos los valores de las columnas especificadas si cumplen la condición especificada.


Hay 5 columnas en el marco de datos recién creado, es decir, 'empresa', 'week1_sales', 'week2_sales', 'week3_sales' y 'sucursales'. Ahora, supongamos que no queremos agregar el valor de la última columna cuando estamos sumando o encontrando la suma de los valores de las filas del marco de datos dado. Digamos que solo queríamos agregar los valores de columna con la palabra 'semana' en sus etiquetas. Se puede crear una lista de comprensión para determinar si la palabra 'semana' está presente en la etiqueta de una columna o no.


Ahora hemos obtenido las columnas que tienen la palabra 'semana' en sus etiquetas. Podemos resumir las columnas que contienen la palabra 'semana' usando el argumento axis=1 en la función sum().


De esta manera, podemos resumir de forma segura los datos de las columnas por filas sin incluir ninguna columna que no queramos.

Ejemplo # 5: Determinar la suma después de agrupar los datos del marco de datos

También podemos encontrar la suma de las columnas del marco de datos después de agrupar los datos de una o más columnas. El método groupby() se utilizará para agrupar los datos en categorías dentro de la columna. Vamos a crear un marco de datos para que podamos agrupar los datos de una de sus columnas.


Ahora agruparemos los datos en la columna 'edad' y sumaremos los valores de las columnas 'puntaje1' y 'puntaje2' para cada categoría del grupo.


Podemos ver que resumir los datos en el marco de datos después de agrupar primero los valores de datos por edad da como resultado una suma por columnas según los grupos de edad.

Conclusión

En este tutorial, tratamos de enseñarle cómo calcular la suma en marcos de datos utilizando el método de suma de Pandas. Hemos discutido la adición de valores por filas y columnas en los ejemplos de esta publicación. Además, aprendió cómo agregar columnas condicionalmente y cómo sumar los valores después de agrupar la columna del marco de datos. Ahora puede sumar las columnas del marco de datos o sumar los valores dentro de la columna del marco de datos usted mismo.