Ordenar el marco de datos en R

Ordenar El Marco De Datos En R



Ordenar los DataFrames en R es una operación crucial en el análisis y manipulación de datos. Significativamente, R proporciona mucha flexibilidad para clasificar los datos en función de varias columnas y clasificarlos en orden ascendente o descendente. En R, la clasificación de los DataFrames se puede lograr usando una variedad de métodos y funciones. En este artículo, repasaremos varias funciones que nos ayudarán a clasificar el DataFrame en cualquiera de los órdenes especificados.

Ejemplo 1: ordenar el marco de datos utilizando el método Order() en R

La función order() en R se usa para ordenar los DataFrames por una o varias columnas. La función order obtiene los índices de las filas ordenadas para reorganizar las filas del DataFrame.

emp = datos. marco ( nombres = C ( 'Andy' , 'Marca' , 'Bonnie' , 'Carolino' , 'John' ) ,

edad = C ( 21 , 23 , 29 , 25 , 32 ) ,

salario = C ( 2000 , 1000 , 1500 , 3000 , 2500 ) )

gato ( ' \norte \norte Marco de datos ordenado por nombres en orden ascendente \norte ' )

sorted_asc = emp [ con ( emp , orden ( nombres ) ) , ]

imprimir ( sorted_asc )

Aquí, definimos el DataFrame 'emp' con tres columnas que contienen diferentes valores. La función cat () se implementa para imprimir la declaración para indicar que se ordenará el marco de datos 'emp' por la columna 'nombres' en orden ascendente. Para esto, usamos la función order() en R que devuelve las posiciones de índice de los valores en un vector que se ordena en orden ascendente. En este caso, la función with() especifica que la columna de 'nombres' debe ordenarse. El DataFrame ordenado se almacena en la variable 'sorted_asc' que se pasa como argumento en la función print() para imprimir los resultados ordenados.







Por lo tanto, los resultados ordenados del DataFrame por la columna 'nombres' en orden ascendente se muestran a continuación. Para obtener la operación de clasificación en orden descendente, solo podemos especificar el signo negativo con el nombre de la columna en la función order() anterior:





Ejemplo 2: ordenar el marco de datos utilizando los parámetros del método Order() en R

Además, la función order() toma los argumentos decrecientes para ordenar el DataFrame. En el siguiente ejemplo, especificamos la función order() con el argumento para ordenar en orden creciente o decreciente:





d.f. = datos. marco (

identificación = C ( 1 , 3 , 4 , 5 , 2 ) ,

curso = C ( 'Pitón' , 'Java' , 'C++' , 'MongoDB' , 'R' ) )

imprimir ( 'Ordenado en orden decreciente por ID' )

imprimir ( d.f. [ orden ( df$id , decreciente = VERDADERO ) , ] )

Aquí, primero declaramos la variable 'df' donde la función data.frame() se define con tres columnas diferentes. Luego, usamos la función print() donde imprimimos un mensaje para indicar que el DataFrame se ordenará en orden decreciente según la columna 'id'. Después de eso, implementamos la función print() nuevamente para realizar la operación de clasificación e imprimir esos resultados. Dentro de la función print(), llamamos a la función 'ordenar' para ordenar el marco de datos 'df' según la columna 'curso'. El argumento 'decreciente' se establece en VERDADERO para ordenar en orden decreciente.

En la siguiente ilustración, la columna 'id' de DataFrame está dispuesta en orden descendente:



Sin embargo, para obtener los resultados de la clasificación en orden ascendente, debemos establecer el argumento decreciente de la función order() con FALSO, como se muestra a continuación:

imprimir ( 'Ordenado en orden creciente por ID' )

imprimir ( d.f. [ orden ( df$id , decreciente = FALSO ) , ] )

Allí, obtenemos el resultado de la operación de clasificación del DataFrame por la columna 'id' en orden ascendente.

Ejemplo 3: ordenar el marco de datos usando el método Arrange() en R

Además, también podemos usar el método Organize() para ordenar un DataFrame por columnas. También podemos ordenar en orden ascendente o descendente. El siguiente código R dado usa la función Organize():

biblioteca ( 'dplyr' )

alumno = datos. marco (

Identificación = C ( 3 , 5 , 2 , 4 , 1 ) ,

marcas = C ( 70 , 90 , 75 , 88 , 92 ) )

imprimir ( 'Clasificación de orden creciente por ID' )

imprimir ( arreglar ( alumno , Identificación ) )

Aquí, cargamos el paquete 'dplyr' de R para acceder al método de ordenación de order(). Luego, tenemos la función data.frame() que contiene dos columnas y establece el DataFrame en la variable 'estudiante'. A continuación, implementamos la función de arreglo () del paquete 'dplyr' en la función de impresión () para ordenar el marco de datos dado. La función de arreglar () toma el DataFrame 'estudiante' como su primer argumento, seguido de la 'Id' de las columnas para ordenar. La función print() al final imprime el DataFrame ordenado en la consola.

Podemos ver dónde se ordena la columna 'Id' en una secuencia en el siguiente resultado:

Ejemplo 4: ordenar el marco de datos por fecha en R

El DataFrame en R también se puede ordenar por los valores de fecha. Para esto, la función ordenada debe especificarse con la función as.date() para formatear las fechas.

Fecha del evento = datos. marco ( evento = C ( '3/4/2023' , '2/2/2023' ,

'10/1/2023' , '29/3/2023' ) ,

cargos = C ( 3100 , 2200 , 1000 , 2900 ) )

Fecha del evento [ orden ( como . Fecha ( evento_fecha$evento , formato = '%d/%m/%Y' ) ) , ]

Aquí, tenemos un marco de datos 'fecha_evento' que contiene la columna 'evento' con las cadenas de fecha en el formato 'mes/día/año'. Necesitamos ordenar estas cadenas de fechas en orden ascendente. Usamos la función order() que ordena el DataFrame por la columna 'evento' en orden ascendente. Logramos esto convirtiendo las cadenas de fecha en la columna 'evento' a las fechas reales usando la función 'as.Date' y especificando el formato de las cadenas de fecha usando el parámetro 'formato'.

Por lo tanto, representamos los datos ordenados por la columna de fecha del 'evento' en orden ascendente.

Ejemplo 5: ordenar el marco de datos usando el método Setorder() en R

De manera similar, setorder() también es otro método para ordenar el DataFrame. Ordena el DataFrame tomando el argumento como el método de arreglo(). El código R para el método setorder() se proporciona de la siguiente manera:

biblioteca ( 'tabla de datos' )

d1 = datos. marco ( Solicitar ID = C ( 1 , 4 , 2 , 5 , 3 ) ,

articulo ordenado = C ( 'manzana' , 'naranja' , 'kiwi' , 'mango' , 'banana' ) )

imprimir ( establecer orden ( d1 , articulo ordenado ) )

Aquí, configuramos primero la biblioteca data.table ya que setorder() es la función de este paquete. Luego, empleamos la función data.frame() para crear el DataFrame. El DataFrame se especifica con solo dos columnas que usamos para ordenar. Después de esto, configuramos la función setorder() dentro de la función print(). La función setorder() toma el DataFrame 'd1' como el primer parámetro y la columna 'orderId' como el segundo parámetro por el cual se ordena el DataFrame. La función 'setorder' reorganiza las filas de la tabla de datos en orden ascendente según los valores de la columna 'orderId'.

El DataFrame ordenado es el resultado en la siguiente consola de R:

Ejemplo 6: ordenar el marco de datos usando el método Row.Names() en R

El método row.names() también es una forma de ordenar el DataFrame en R. Row.names() ordena los DataFrames por la fila especificada.

d.f. < - datos. marco ( equipo = C ( 'X' , 'X' , 'Y' , 'Y' , 'CON' ) ,

puntaje = C ( 91 , 80 , 86 , 83 , 95 ) )

fila. nombres ( d.f. ) < - C ( 'A' , 'D' , 'C' , 'Y' , 'B' )

d.f. [ orden ( fila. nombres ( d.f. ) ) , ]

Aquí se establece la función data.frame() dentro de la variable “df” donde se especifican las columnas con los valores. Luego, los nombres de las filas del DataFrame se especifican usando la función row.names(). Después de eso, llamamos a la función order() para ordenar el DataFrame por nombres de fila. La función order() devuelve los índices de las filas ordenadas que se utilizan para reorganizar las filas del DataFrame.

La salida muestra el DataFrame ordenado por filas alfabéticamente:

Conclusión

Hemos visto las diferentes funciones para ordenar los DataFrames en R. Cada uno de los métodos tiene una ventaja y necesita la operación de ordenación. Puede haber más métodos o formas de ordenar el DataFrame en lenguaje R, pero los métodos order(), Organize() y setorder() son los más importantes y fáciles de usar para ordenar.