Obtenga un número de columnas en R DataFrame

Obtenga Un Numero De Columnas En R Dataframe



En R, obtener el número de columnas es una operación básica que se requiere en muchas situaciones cuando se trabaja con DataFrames. Al subdividir, analizar, manipular, publicar y visualizar los datos, el recuento de columnas es una información crucial que debe conocer. Por lo tanto, R proporciona diferentes enfoques para obtener el total de las columnas del DataFrame especificado. En este artículo, discutiremos algunos de los enfoques que nos ayudan a obtener el recuento de las columnas del DataFrame.

Ejemplo 1: uso de la función Ncol()

La ncol() es la función más frecuente para obtener el total de las columnas de los DataFrames.







df <- data.frame('y1' = c(10, 12, 14, 19),

'y2' = c(15, 22, 24, 29),
'y3' = c(25, 32, 34, 39))


n <- ncol(df)

cat('-----Número de columnas en el marco de datos:', n)

En este ejemplo, primero creamos un DataFrame 'df' con tres columnas que están etiquetadas como 'y1', 'y2' e 'y3' usando la función data.frame() en R. Los elementos en cada columna se especifican usando la función c() que crea un vector de elementos. Luego, usando la variable “n”, la función ncol() se usa para determinar el total de columnas en el DataFrame “df”. Finalmente, con el mensaje descriptivo y la variable “n”, la función cat() provista imprime los resultados en la consola.



Como era de esperar, la salida recuperada indica que el DataFrame especificado tiene tres columnas:







Ejemplo 2: cuente las columnas totales para el marco de datos vacío

A continuación, aplicamos la función ncol() al marco de datos vacío que también obtiene los valores de las columnas totales, pero ese valor es cero.

df_vacío <- datos.marco()

n <- ncol(empty_df)

cat('---Columnas en el marco de datos:', n)

En este ejemplo, generamos el DataFrame vacío, 'empty_df', llamando a data.frame() sin especificar ninguna columna o fila. A continuación, usamos la función ncol() que se usa para encontrar el recuento de columnas en el DataFrame. La función ncol() se establece aquí con el marco de datos 'empty_df' para obtener las columnas totales. Dado que el marco de datos 'empty_df' está vacío, no tiene ninguna columna. Entonces, la salida de ncol(empty_df) es 0. La función cat() que se implementa aquí muestra los resultados.



La salida muestra el valor '0' como se esperaba porque el DataFrame está vacío.

Ejemplo 3: uso de la función Select_If() con la función Length()

Si queremos recuperar el número de columnas de cualquier tipo específico, debemos usar la función select_if() junto con la función length() de R. Estas funciones se usan y se combinan para obtener el total de las columnas de cada tipo . El código para usar estas funciones se implementa de la siguiente manera:

biblioteca (dplyr)

x1<-LETRAS[1:10]

x2<-rpois(10,2)

x3<-rpois(10,5)

x4<-muestra(c('Verano','Invierno'),10,reemplazar=VERDADERO)

df1<-datos.marco(x1,x2,x3,x4)

df1

longitud(select_if(df1,is.numeric))

En este ejemplo, primero cargamos el paquete dplyr para poder acceder a la función select_if() y la función length(). Luego, creamos las cuatro variables: 'x1', 'x2', 'x3' y 'x4', respectivamente. Aquí, “x1” contiene las primeras 10 letras mayúsculas del alfabeto inglés. Las variables 'x2' y 'x3' se generan utilizando la función rpois() para crear dos vectores separados de 10 números aleatorios con parámetros 2 y 5, respectivamente. La variable 'x4' es un vector de factores con 10 elementos que se muestrean aleatoriamente del vector c ('Verano', 'Invierno').

Luego, intentamos crear el DataFrame 'df1' donde todas las variables se pasan en la función data.frame(). Finalmente, invocamos la función length() para determinar la longitud del DataFrame 'df1' que se crea usando la función select_if() del paquete dplyr. La función select_if() selecciona las columnas de un DataFrame 'df1' como argumento y la función is.numeric() selecciona solo las columnas que contienen valores numéricos. Luego, la función length() obtiene el total de columnas seleccionadas por select_if(), que es la salida de todo el código.

La longitud de la columna se muestra en el siguiente resultado que indica el total de columnas del DataFrame:

Ejemplo 4: Uso de la función Saapply()

Por el contrario, si solo queremos contar los valores faltantes de las columnas, tenemos la función sapply(). La función sapply() itera sobre cada columna del DataFrame para operar específicamente. La función sapply() se pasa primero con el DataFrame como argumento. Luego, toma la operación a realizar en ese DataFrame. La implementación de la función sapply() para obtener el recuento de valores NA en las columnas de DataFrame se proporciona de la siguiente manera:

new_df <- data.frame(c1 = c(10, 11, NA, 13, NA),

c2 = c('N', NA, 'A', 'M', 'E'),
c3 = c(NA, 92, NA, NA, 95))

sapply(nuevo_df, función(x) suma(es.na(x)))

En este ejemplo, generamos el marco de datos 'new_df' con tres columnas: 'c1', 'c2' y 'c3'. Las primeras columnas, 'c1' y 'c3', contienen los valores numéricos, incluidos algunos valores faltantes que están representados por NA. La segunda columna, 'c2', contiene los caracteres, incluidos algunos valores faltantes, que también está representado por NA. Luego, aplicamos la función sapply() al marco de datos 'new_df' y calculamos la cantidad de valores faltantes en cada columna usando la expresión sum() dentro de la función sapply().

La función is.na() es la expresión que se especifica en la función sum() que devuelve un vector lógico que indica si falta o no cada elemento de la columna. La función sum() suma los valores VERDADEROS para contar el número de valores que faltan en cada columna.

Por lo tanto, la salida muestra los valores NA totales en cada una de las columnas:

Ejemplo 5: Uso de la función Dim()

Además, queremos obtener el total de columnas junto con las filas del DataFrame. Luego, la función dim() proporciona las dimensiones del DataFrame. La función dim() toma el objeto como argumento cuyas dimensiones queremos recuperar. Aquí está el código para usar la función dim():

d1 <- data.frame(equipo=c('t1', 't2', 't3', 't4'),

puntos=c(8, 10, 7, 4))

tenue (d1)

En este ejemplo, primero definimos el DataFrame 'd1' que se genera usando la función data.frame() donde se establecen dos columnas 'equipo' y 'puntos'. Después de eso, invocamos la función dim() sobre el marco de datos 'd1'. La función dim() devuelve el número de filas y columnas del DataFrame. Por lo tanto, cuando ejecutamos dim(d1), devuelve un vector con dos elementos: el primero refleja el número de filas en el marco de datos 'd1' y el segundo representa el número de columnas.

La salida representa las dimensiones del DataFrame donde el valor '4' indica el total de columnas y el valor '2' representa las filas:

Conclusión

Ahora aprendimos que contar el número de columnas en R es una operación simple e importante que se puede realizar en el DataFrame. Entre todas las funciones, la función ncol() es la forma más conveniente. Ahora, estamos familiarizados con las diferentes formas de obtener la cantidad de columnas del DataFrame dado.