Pandas al Diccionario

Pandas Al Diccionario



“En Python, se usa una estructura de datos llamada diccionario para almacenar información como pares clave-valor. Los objetos del diccionario están optimizados para extraer datos/valores cuando se conocen la clave o las claves. Tenga en cuenta que los diccionarios pueden incluir claves duplicadas. Para encontrar valores de manera eficiente utilizando el índice relacionado, podemos convertir una serie de pandas o un marco de datos con un índice relevante en un objeto de diccionario con pares clave-valor 'índice: valor'. Para lograr esta tarea, se puede utilizar el método “to_dict()”. Esta función es una función integrada que se encuentra en la clase Serie del módulo pandas. Un marco de datos se convierte en un diccionario de datos similar a una lista de Python de series utilizando el método pandas.to_dict(), según el valor especificado del parámetro orient.

¿Cómo convertir pandas en un diccionario de Python?

Existen múltiples métodos para convertir pandas en un diccionario. Sin embargo, para transformar un marco de datos de Pandas en un diccionario de Python, usaremos el método to_dict() en Pandas. Podemos orientar los pares clave-valor del diccionario devuelto en una variedad de formas usando la función to_dict(). La sintaxis de la función es la siguiente:







Sintaxis

 



pandas.to_dict ( este = 'dict', dentro = )

 



Parámetros

orientar: El tipo de datos para convertir columnas (series en) se especifica mediante el valor de la cadena ('dict', 'list', 'registros', 'index', 'series', 'split'). Por ejemplo, la palabra clave 'lista' daría como salida un diccionario Python de objetos de lista con las claves 'Nombre de columna' y 'Lista' (serie convertida).





dentro: clase, se puede pasar como una instancia o una clase real. Por ejemplo, se puede pasar una instancia de clase en el caso de un dictado predeterminado. El valor predeterminado del parámetro es dict.

Tipo de retorno: Diccionario convertido de un marco de datos o serie.



Ejemplo # 01: Convertir el marco de datos de Pandas en un diccionario

Usando la tupla de listas en la función pd.DataFrame(), crearemos un marco de datos básico con algunas columnas y filas para que luego podamos convertirlo en un diccionario de python.


Hemos creado nuestro dataframe pasando la lista dentro de la función pd.DataFrame(). En el marco de datos anterior, tenemos tres columnas 'empresa', 'ventas' e 'ingresos'. En la columna empresa, hemos almacenado los nombres de empresas aleatorias como ('A&B', 'Max_tech', 'XT', 'MJ', 'Quanto', 'Mini_X', 'Zomo', 'AU', 'HL' , “ZMX”, “Earny”), la columna “ventas” representa las ventas de cada empresa como (“217”, “200”, “199”, “150”, “210”, “216”, “185 ”, “189”, “202”, “159”, “205”), y la columna “ingresos” almacena los valores que representan los ingresos de cada empresa frente a las ventas respectivas (340000   320000  300000 270000  315000  335000  250000     255000   301000 0 0 2444 305000). Ahora convertiremos nuestro marco de datos 'df' en un diccionario de python.


Al aplicar el método to_dict() al marco de datos df, hemos convertido un marco de datos de pandas en un diccionario.

Ejemplo n.º 02: Conversión del marco de datos de Pandas creado a partir de un archivo CSV en un diccionario

En el ejemplo # 1, creamos un dataframe usando tuplas dentro de la lista. Ahora crearemos un marco de datos con la ayuda de un archivo CSV y luego lo convertiremos en un diccionario usando la función to_dict().


Para leer un archivo como marco de datos, hemos utilizado la función pd.read_csv(). En el marco de datos anterior, tenemos dos columnas (Nombre y Marcas) y diecisiete filas (de 0 a 16). Ahora usaremos el método to_dict().


La función ha convertido nuestro marco de datos 'df' en un diccionario de Python.

Ejemplo # 03: Convierta el marco de datos de Pandas al diccionario que contiene las listas de valores

En los ejemplos anteriores, hemos convertido los pandas en un diccionario de Python que contiene varios diccionarios. Al convertir un marco de datos en un objeto de diccionario, las etiquetas de las columnas deben servir como claves del diccionario, y todos los datos o valores de las columnas deben agregarse al diccionario resultante como una lista de valores para cada clave.


Hemos creado el marco de datos con tres columnas 'nombre', 'país' y 'edad'. En la columna 'nombre', hemos almacenado los valores de datos ('Anna', 'Marty', 'Carl', 'Mary', 'Cleb', 'Ali', 'Alexa', 'Becky', 'Ryan') . Mientras que las otras columnas país y edad son valores fuertes como ('EE.UU.', 'Inglaterra', 'EE.UU.', 'Francia', 'Rusia', 'Rusia', 'Francia', 'Inglaterra', 'EE.UU.') y ( 34, 32, 30, 27, 31, 33, 35, 25, 30) respectivamente. Crearemos un diccionario que contenga las listas usando el parámetro 'lista' dentro del método to_dict().


Al usar el parámetro list como argumento dentro de la función to_list(), hemos generado un diccionario que contiene varias listas.

Ejemplo # 03: Convierta el marco de datos de Pandas al diccionario que contiene la serie de valores

Cuando un DataFrame necesita transformarse en un diccionario, el nombre de la columna sirve como las claves del diccionario y el índice de la fila y los datos en la columna como un valor para las claves correspondientes en el diccionario.


Hemos creado el dataframe requerido usando el método pd.DataFrame(). En el marco de datos creado recientemente, tenemos dos columnas. La columna de nombre almacena los valores de datos como una cadena ('Kim', 'Morris', 'Casper', 'Milli', 'Dave', 'Will', 'Billy'), mientras que las columnas de marcas constan de datos numéricos como ( 8, 9, 6, 7, 10, 7, 8). Usaremos el parámetro 'series' como una cadena dentro de la función to_dict().

Ejemplo # 04: Convierta el marco de datos de Pandas al diccionario sin índice y encabezado

El parámetro 'split' de la función to_dict() se puede usar para extraer datos de un DataFrame sin los encabezados de las columnas o cuando necesitamos eliminar el encabezado y el índice de fila de los datos. Las etiquetas de columna, el índice de fila y los datos reales se dividen en tres componentes mediante este parámetro. Vamos a crear un marco de datos, para que podamos dividirlo en tres partes mientras lo convertimos en el diccionario.


Hemos creado dos columnas con etiquetas 'nombre' y 'edad' que contienen valores ('Dave', 'Morris', 'Billy', 'Milli', 'Kim', 'Will', 'Casper') y (19, 19 , 25, 21, 19, 21, 23) respectivamente. Vamos a convertirlos a diccionarios de python.


Usando la clave 'datos', podemos recuperar los datos del diccionario resultante sin un índice o encabezado.

Ejemplo n.º 05: convertir el marco de datos de Pandas al diccionario por fila e índice de fila

El parámetro 'registro' se puede usar dentro de la función to_dict() para almacenar datos de cada fila de marco de datos en múltiples objetos de diccionario distintos dentro de una lista o cuando se requieren datos de fila. Se devolverá una lista que contiene objetos de diccionario. Un diccionario con una etiqueta de columna como clave y datos de columna como valor para cada fila.


Hemos creado un marco de datos con las columnas 'nombre' y 'salario'. La columna 'nombre' contiene los valores de datos ('Leo', 'Haris', 'Wanda', 'Mike', 'Kelly', 'Adam', 'Jack'), y la columna de salario almacena los valores (12000, 12500 , 14000, 11000, 12000, 13000, 12500). Ahora vamos a crear una lista con varios diccionarios de Python que contengan datos de cada fila.


El parámetro de índice también se puede usar para convertir los datos de cada fila de un marco de datos a un diccionario. Se devolverá una lista que contiene elementos del diccionario. Cada fila genera un diccionario. Donde el índice de la fila será la clave y el valor será el diccionario de datos y la etiqueta de la columna.

Conclusión

En este tutorial, hemos discutido cómo podemos convertir el marco de datos o los objetos pandas en un diccionario de python. Hemos visto la sintaxis de la función to_dict() para comprender los parámetros de esta función y cómo puede modificar la salida de la función especificando la función con diferentes parámetros. En los ejemplos de este tutorial, hemos usado el método to_dict(), una función pandas incorporada, para cambiar los objetos pandas al diccionario de python.