Desviación estándar de pandas

Desviacion Estandar De Pandas



“El “Pandas” es un gran lenguaje para realizar el análisis de datos debido a su gran ecosistema de paquetes de python centrados en datos. Eso facilita el análisis y la importación de ambos factores. La desviación estándar es una desviación 'típica' derivada de la media. Se usa mucho, ya que devuelve las unidades de medida originales del marco de datos. Los pandas usaron std() para el cálculo de la desviación estándar. La desviación estándar se puede calcular a partir de los valores dados que pueden estar en el marco de datos en forma de fila o columna. Implementaremos todas las formas posibles en que se usa la desviación estándar de pandas. Para la implementación del código, utilizaremos la herramienta 'spyder' ya que está escrita en un entorno compatible con Python'.

Sintaxis

 







“df.std ( )

 
La siguiente sintaxis se utiliza para calcular la desviación estándar en el marco de datos. El 'df' en el marco de datos es la abreviatura del 'marco de datos'. ¿Qué hace la desviación estándar? Mide qué tan extensos son los datos requeridos. Cuanto más expandidos sean los valores altos, mayor será la desviación estándar.



Devolver

La desviación estándar de pandas devuelve el marco de datos si el nivel se especifica en función del requisito.



Tenga en cuenta que la función 'std ()' ignorará automáticamente los valores 'NaN' en el 'df' mientras calcula la desviación estándar de pandas. 'NaN' se puede explicar como 'no es un número', lo que significa que no hay un valor asignado a un particular.





Los siguientes son los métodos que se ejecutarán con ejemplos de la desviación estándar de pandas:

    • Cálculo de la desviación estándar de Pandas en una sola columna.
    • Cálculo de la desviación estándar de Pandas en varias columnas.
    • Cálculo de la desviación estándar de Pandas de todas las columnas numéricas.
    • desviación estándar de pandas usando el eje = 1.
    • desviación estándar de pandas usando el eje = 0.

Creando el Dataframe para el Cálculo de la Desviación Estándar en Pandas

Primero, abra el software 'spyder'. Ahora importe la biblioteca de pandas como pd. Crearemos un marco de datos que consiste en un marcador que tiene términos como 'x', 'y' y 'z' con sus puntos como '22', '10', '11', '16', '12', '45 ”, “36” y “40”. Tenemos sus valores de asistencias como “8”, “9”, “13”, “7”, “22”, “24”, “4” y “6” también, teniendo el valor de rebotes como “17”, “ 14”, “3”, 5”, “9”, “8”, “7” y “4”.




Las pantallas muestran el marco de datos creado de acuerdo con los valores asignados en el código:

Ejemplo # 01: Cálculo de desviación estándar de Pandas en una sola columna

En este ejemplo, calcularemos la desviación estándar de una sola columna en el marco de datos de pandas. El dataframe tiene los valores del equipo como “u”, “v” y “b” con sus puntos como “44”, “33”, “22”, “44”, “45”, “88”, “96 ” y “78”. Los valores de asistencias son como “7”, “8”, “9”, “10”, “11”, “14”, “18” y “17” teniendo también los valores de rebotes como “11”, “ 9”, “8”, “7”, “6”, “5”, “4” y “3”. La columna 'puntos' se selecciona del marco de datos para calcular la desviación estándar de una sola columna.


El resultado muestra la desviación estándar calculada de la columna 'puntos':

Ejemplo # 02: Cálculo de desviación estándar de Pandas en múltiples columnas

En este ejemplo, ejecutaremos los cálculos de desviación estándar de pandas en varias columnas. En este marco de datos, los datos son nuevamente del marcador deportivo que tiene los valores del equipo como 'n', 'w' y 't' con la puntuación como '33', '22', '66', '55', “44”, “88”, “99” y “77”. Las asistencias como “9”, “7”, “8”, “11”, “16”, “14”, “12” y “13” y los rebotes como “5”, “8”, “1”, “ 2”, “3”, “4”, “6” y “7”. Aquí calcularemos la desviación estándar de las dos columnas 'puntos' y 'rebotes' usando la función std() aplicada al marco de datos.


Como vemos, el resultado muestra que la desviación estándar resultó ser 26,944387 en la columna de puntos y 2,449490 en la columna de rebote, respectivamente.

Ejemplo # 03: Cálculo de desviación estándar de Pandas de todas las columnas numéricas

Ahora hemos aprendido cómo calcular la desviación estándar de filas únicas y múltiples. ¿Qué sucede si no queremos especificar todos los nombres de columna en el marco de datos y calcular el marco de datos completo? Esto es posible con solo una implementación de función simple de la desviación estándar de pandas para el cálculo del marco de datos completo en los resultados. El marco de datos aquí consta de 'l', 'm' y 'o' con los valores de puntuación '33', '36', '79', '78', '58', '55', y dos equipos puntúan lo mismo eso es '25'. Las asistencias son como “1”, “2”, “3”, “4”, “6”, “9”, “5” y “7” y sus rebotes como “14”, “10”, “2” , “5”, “8”, “3”, “6” y “9”. Podemos calcular todas las desviaciones de columna estándar por pandas en el marco de datos usando la función 'std()' de pandas.


La pantalla tiene la desviación estándar calculada de todo el 'df' que se muestra a continuación; también podemos notar que los pandas no han calculado la desviación estándar de la primera columna, que es “equipo”, porque no es una columna numérica.

Ejemplo # 04: Desviación Estándar de Pandas Usando el Eje = 0

En este ejemplo, los marcos de datos tienen los equipos de los deportes como 'g', 'h' y 'k' con más datos. Aquí, calcularemos la desviación estándar utilizando el eje como '0', un parámetro utilizado en la desviación estándar de pandas. Este argumento calcula la desviación estándar por columnas del marco de datos.


El siguiente resultado muestra los resultados en columnas de la desviación estándar calculada. La columna de puntos tiene la desviación estándar calculada como '24.0313062', la columna de asistencias tiene la desviación estándar calculada como '2.669270' y la desviación estándar calculada de la columna de rebote se muestra como '3.943802'.

Ejemplo # 05: Desviación Estándar de Pandas Usando el Eje = 1

Aquí usaremos el parámetro del eje asignado como '1' para calcular la desviación estándar en pandas. ¿Qué diferencia puede hacer el eje “1”? El argumento del eje '1' calcula la desviación estándar por filas de los valores numéricos en el marco de datos. El marco de datos tiene los tres equipos como 's', 'd' y 'e', con la adición de columnas de datos creadas como puntos del equipo, asistencias del equipo y rebotes del equipo. Todas las direcciones se asignan con diferentes valores en el marco de datos. Este parámetro del eje cambia las reglas del juego ya que, en ese momento, necesitamos trabajar en los datos donde queremos que estén en una columna más el punto calculado de la desviación estándar realizada.


El siguiente resultado muestra la desviación estándar calculada en una fila del marco de datos:

Conclusión

La desviación estándar de Pandas es una función muy técnica, que es una función muy beneficiosa ya que encuentra la desviación estándar de los marcos de datos del pacto de entusiasmo de pandas. En este editorial, hemos estudiado los métodos para calcular la desviación estándar en pandas. Hemos realizado cálculos de columna única de desviación estándar y columnas múltiples y también calculamos la desviación estándar de todo el marco de datos juntos. Todas las estrategias funcionan bien siempre que se utilicen de manera consistente y con los resultados deseados.