20 ejemplos de awk

20 Awk Examples



Existen muchas herramientas de utilidad en el sistema operativo Linux para buscar y generar un informe a partir de datos de texto o archivos. El usuario puede realizar fácilmente muchos tipos de tareas de búsqueda, sustitución y generación de informes mediante los comandos awk, grep y sed. awk no es solo un comando. Es un lenguaje de secuencias de comandos que se puede utilizar tanto desde la terminal como desde el archivo awk. Es compatible con la variable, la declaración condicional, la matriz, los bucles, etc., como otros lenguajes de secuencias de comandos. Puede leer el contenido de cualquier archivo línea por línea y separar los campos o columnas según un delimitador específico. También admite expresiones regulares para buscar una cadena en particular en el contenido del texto o en el archivo y realiza acciones si se encuentra alguna coincidencia. En este tutorial se muestra cómo puede usar el comando y el script awk usando 20 ejemplos útiles.

Contenido:

  1. awk con printf
  2. awk para dividir en espacios en blanco
  3. awk para cambiar el delimitador
  4. awk con datos delimitados por tabuladores
  5. awk con datos csv
  6. awk regex
  7. awk expresión regular insensible a mayúsculas y minúsculas
  8. awk con variable nf (número de campos)
  9. Función awk gensub ()
  10. awk con función rand ()
  11. función definida por el usuario awk
  12. awk si
  13. variables awk
  14. matrices awk
  15. bucle awk
  16. awk para imprimir la primera columna
  17. awk para imprimir la última columna
  18. awk con grep
  19. awk con el archivo de script bash
  20. awk con sed

Usando awk con printf

printf () La función se utiliza para formatear cualquier salida en la mayoría de los lenguajes de programación. Esta función se puede utilizar con awk comando para generar diferentes tipos de salidas formateadas. El comando awk se usa principalmente para cualquier archivo de texto. Crea un archivo de texto llamado employee.txt con el contenido que se muestra a continuación, donde los campos están separados por tabulaciones (' t').







employee.txt



1001 Juan sena 40000
1002 Jafar Iqbal 60000
1003 Meher Nigar 30000
1004 Jonny hígado 70000

El siguiente comando awk leerá datos de employee.txt archivo línea por línea e imprima el primer archivo después de formatear. Aquí, % 10s n significa que la salida tendrá una longitud de 10 caracteres. Si el valor de la salida es inferior a 10 caracteres, los espacios se agregarán al principio del valor.



$ awk'{printf'% 10s orte', $1 }'empleado.TXT

Producción:





Ir a Contenido



awk para dividir en espacios en blanco

El separador de campo o palabra predeterminado para dividir cualquier texto es el espacio en blanco. El comando awk puede tomar un valor de texto como entrada de varias formas. El texto de entrada se pasa de echo comando en el siguiente ejemplo. El texto, ' Me gusta programar 'Se dividirá de forma predeterminada, espacio y la tercera palabra se imprimirá como salida.

$echo 'Me gusta programar' | awk '{imprimir $ 3}'

Producción:

Ir a Contenido

awk para cambiar el delimitador

El comando awk se puede utilizar para cambiar el delimitador de cualquier contenido de archivo. Supongamos que tiene un archivo de texto llamado phone.txt con el siguiente contenido donde ':' se utiliza como separador de campo del contenido del archivo.

phone.txt

+123:334:889:778
+880:1855:456:907
+9:7777:38644:808

Ejecute el siguiente comando awk para cambiar el delimitador, ‘:’ por ‘-’ al contenido del archivo, phone.txt .

$ cat phone.txt
$ awk '$ 1 = $ 1' FS = ':' OFS = '-' teléfono.txt

Producción:

Ir a Contenido

awk con datos delimitados por tabuladores

El comando awk tiene muchas variables integradas que se utilizan para leer el texto de diferentes maneras. Dos de ellos son FS y OFS . FS es el separador de campo de entrada y OFS son variables de separación de campos de salida. Los usos de estas variables se muestran en esta sección. Crear un pestaña archivo separado llamado input.txt con el siguiente contenido para probar los usos de FS y OFS variables.

Input.txt

Lenguaje de secuencias de comandos del lado del cliente
Lenguaje de secuencias de comandos del lado del servidor
Servidor de base de datos
Servidor web

Usando la variable FS con pestaña

El siguiente comando dividirá cada línea de input.txt archivo basado en la pestaña (' t') e imprima el primer campo de cada línea.

$awk '{imprimir $ 1}' FS=' t'input.txt

Producción:

Usando la variable OFS con pestaña

El siguiente comando awk imprimirá el 9th y 5th campos de 'Ls -l' salida de comando con separador de tabulación después de imprimir el título de la columna Nombre y Tamaño . Aquí, OFS La variable se utiliza para formatear la salida mediante una pestaña.

$ls -los
$ls -los | awk -v OFS=' t' 'BEGIN {printf'% s t% s n ',' Nombre ',' Tamaño '} {print $ 9, $ 5}'

Producción:

Ir a Contenido

awk con datos CSV

El contenido de cualquier archivo CSV se puede analizar de varias formas mediante el comando awk. Cree un archivo CSV llamado ' customer.csv ’Con el siguiente contenido para aplicar el comando awk.

customer.txt

Id, nombre, correo electrónico, teléfono
1, Sophia, [correo electrónico protegido], (862) 478-7263
2, Amelia, [correo electrónico protegido], (530) 764-8000
3, Emma, ​​[correo electrónico protegido], (542) 986-2390

Lectura de un solo campo de archivo CSV

'-F' La opción se usa con el comando awk para establecer el delimitador para dividir cada línea del archivo. El siguiente comando awk imprimirá el nombre campo de el cliente.csv expediente.

$gatocustomer.csv
$awk -F ',' '{imprimir $ 2}'customer.csv

Producción:

Leer varios campos combinándolos con otro texto

El siguiente comando imprimirá tres campos de customer.csv combinando el texto del título, Nombre, correo electrónico y teléfono . La primera línea del customer.csv archivo contiene el título de cada campo. NO La variable contiene el número de línea del archivo cuando el comando awk analiza el archivo. En este ejemplo, el NR La variable se usa para omitir la primera línea del archivo. La salida mostrará el 2Dakota del Norte, 3rdy 4thcampos de todas las líneas excepto la primera línea.

$awk -F ',' 'NR> 1 {print' Nombre: '$ 2', Correo electrónico: '$ 3', Teléfono: '$ 4}'customer.csv

Producción:

Leyendo un archivo CSV usando un script awk

El script awk se puede ejecutar ejecutando el archivo awk. En este ejemplo se muestra cómo puede crear un archivo awk y ejecutarlo. Crea un archivo llamado awkcsv.awk con el siguiente código. EMPEZAR La palabra clave se usa en el script para informar al comando awk para ejecutar el script del EMPEZAR parte primero antes de ejecutar otras tareas. Aquí, separador de campo ( FS ) se utiliza para definir el delimitador de división y 2Dakota del Nortey 1S tLos campos se imprimirán de acuerdo con el formato utilizado en la función printf ().

awkcsv.awk
EMPEZAR{FS= ','} { printf '% 5s (% s) orte',$2,$1}

Correr awkcsv.awk archivo con el contenido de el cliente.csv archivo con el siguiente comando.

$awk -Fawkcsv.awk customer.csv

Producción:

Ir a Contenido

awk regex

La expresión regular es un patrón que se usa para buscar cualquier cadena en un texto. Se pueden realizar muy fácilmente diferentes tipos de tareas complicadas de búsqueda y reemplazo utilizando la expresión regular. En esta sección se muestran algunos usos simples de la expresión regular con el comando awk.

Personaje a juegocolocar

El siguiente comando coincidirá con la palabra Tonto o tonto o Frio con la cadena de entrada e imprima si la palabra se encuentra. Aquí, Muñeca no coincidirá y no se imprimirá.

$printf 'Tonto orteFrio orteMuñeca ortebool ' | awk '/ [FbC] ool /'

Producción:

Buscando cadena al comienzo de la línea

‘^’ El símbolo se usa en la expresión regular para buscar cualquier patrón al comienzo de la línea. ' Linux ’ La palabra se buscará al comienzo de cada línea del texto en el siguiente ejemplo. Aquí, dos líneas comienzan con el texto, 'Linux 'Y esas dos líneas se mostrarán en la salida.

$echo -Y 'Linux es de uso gratuito orteEs un software de código abierto. orteLinuxHint es
un sitio de blogs popular '
| awk '/ ^ Linux /'

Producción:

Buscando cadena al final de la línea

‘$’ El símbolo se utiliza en la expresión regular para buscar cualquier patrón al final de cada línea del texto. ' Texto 'Palabra se busca en el siguiente ejemplo. Aquí, dos líneas contienen la palabra, Texto al final de la línea.

$echo -Y 'Script PHP orteJavaScript orteProgramación visual ' | awk '/ Script $ /'

Producción:

Búsqueda omitiendo un conjunto de caracteres en particular

‘^’ El símbolo indica el comienzo del texto cuando se usa delante de cualquier patrón de cuerda. (‘/^…/’) o antes de cualquier juego de caracteres declarado por ^[…] . Si el ‘^’ El símbolo se usa dentro del tercer corchete, [^…] entonces el juego de caracteres definido dentro del corchete se omitirá en el momento de la búsqueda. El siguiente comando buscará cualquier palabra que no comience con 'F' pero terminando con ' ool ’. Frio y bool se imprimirá de acuerdo con el patrón y los datos de texto.

$ printf 'Tonto orteFrio orteMuñeca ortebool ' |awk'/ [^ F] ool /'

Producción:

Ir a Contenido

awk expresión regular insensible a mayúsculas y minúsculas

De forma predeterminada, la expresión regular hace una búsqueda sensible a mayúsculas y minúsculas al buscar cualquier patrón en la cadena. La búsqueda que no distingue entre mayúsculas y minúsculas se puede realizar mediante el comando awk con la expresión regular. En el siguiente ejemplo, reducir() La función se utiliza para realizar búsquedas que no distinguen entre mayúsculas y minúsculas. Aquí, la primera palabra de cada línea del texto de entrada se convertirá a minúsculas usando reducir() funcionan y coinciden con el patrón de expresión regular. toupper () La función también se puede utilizar para este propósito, en este caso, el patrón debe estar definido por todas las letras mayúsculas. El texto definido en el siguiente ejemplo contiene la palabra de búsqueda, ‘web ’En dos líneas que se imprimirán como salida.

$echo -Y 'Web Design ortedesarrollo web orteEstructura' | awk 'tolower ($ 0) ~ / ^ web /;'

Producción:

Ir a Contenido

awk con variable NF (número de campos)

NF es una variable incorporada del comando awk que se utiliza para contar el número total de campos en cada línea del texto de entrada. Cree cualquier archivo de texto con varias líneas y varias palabras. el input.txt Aquí se utiliza el archivo que se creó en el ejemplo anterior.

Usando NF desde la línea de comando

Aquí, el primer comando se usa para mostrar el contenido de input.txt archivo y el segundo comando se usa para mostrar el número total de campos en cada línea del archivo usando NF variable.

$ cat input.txt
$ awk '{print NF}' input.txt

Producción:

Usando NF en un archivo awk

Crea un archivo awk llamado count.awk con el guión que se proporciona a continuación. Cuando este script se ejecute con cualquier dato de texto, el contenido de cada línea con el total de campos se imprimirá como salida.

count.awk

{imprimir $0}
{impresión'[Campos totales:'NF']'}

Ejecute el script con el siguiente comando.

$awk -Fcount.awk input.txt

Producción:

Ir a Contenido

Función awk gensub ()

getsub () es una función de sustitución que se utiliza para buscar cadenas según un delimitador particular o un patrón de expresión regular. Esta función se define en 'papar moscas' paquete que no está instalado por defecto. La sintaxis de esta función se proporciona a continuación. El primer parámetro contiene el patrón de expresión regular o delimitador de búsqueda, el segundo parámetro contiene el texto de reemplazo, el tercer parámetro indica cómo se realizará la búsqueda y el último parámetro contiene el texto en el que se aplicará esta función.

Sintaxis:

gensub(regexp, reemplazo, cómo[, objetivo])

Ejecute el siguiente comando para instalar papar moscas paquete para usar getsub () función con el comando awk.

$ sudo apt-get install gawk

Cree un archivo de texto llamado ' salesinfo.txt ’Con el siguiente contenido para practicar este ejemplo. Aquí, los campos están separados por una pestaña.

salesinfo.txt

Mi 700000
Tu 800000
Mié 750000
Recoge 200000
Vie 430000
Sáb 820000

Ejecute el siguiente comando para leer los campos numéricos del salesinfo.txt archivar e imprimir el total de todas las ventas. Aquí, el tercer parámetro, 'G' indica la búsqueda global. Eso significa que el patrón se buscará en todo el contenido del archivo.

$awk '{x = gensub (' t ',' ',' G ', $ 2); printf x '+'} END {print 0} 'salesinfo.txt| antes de Cristo -los

Producción:

Ir a Contenido

awk con función rand ()

hilera() La función se usa para generar cualquier número aleatorio mayor que 0 y menor que 1. Por lo tanto, siempre generará un número fraccionario menor que 1. El siguiente comando generará un número aleatorio fraccionario y multiplicará el valor por 10 para obtener un número mayor que 1. Se imprimirá un número fraccionario con dos dígitos después del punto decimal para aplicar la función printf (). Si ejecuta el siguiente comando varias veces, obtendrá un resultado diferente cada vez.

$awk 'BEGIN {printf' El número es =%. 2f n ', rand () * 10}'

Producción:

Ir a Contenido

función definida por el usuario awk

Todas las funciones que se utilizan en los ejemplos anteriores son funciones integradas. Pero puede declarar una función definida por el usuario en su script awk para realizar cualquier tarea en particular. Suponga que desea crear una función personalizada para calcular el área de un rectángulo. Para realizar esta tarea, cree un archivo llamado ' area.awk ’Con la siguiente secuencia de comandos. En este ejemplo, una función definida por el usuario llamada zona() se declara en el script que calcula el área en función de los parámetros de entrada y devuelve el valor del área. obtener línea El comando se usa aquí para recibir información del usuario.

area.awk

# Calcular área
funciónzona(altura,ancho){
regresoaltura*ancho
}

# Inicia ejecución
EMPEZAR{
impresión'Introduzca el valor de la altura:'
getline h< '-'
impresión'Ingrese el valor de ancho:'
getline w< '-'
impresión'Área ='zona(h,en)
}

Ejecute el script.

$awk -Farea.awk

Producción:

Ir a Contenido

awk if ejemplo

awk admite declaraciones condicionales como otros lenguajes de programación estándar. En esta sección se muestran tres tipos de declaraciones if mediante tres ejemplos. Crea un archivo de texto llamado items.txt con el siguiente contenido.

items.txt

HDD Samsung $ 100
Ratón A4Tech
Impresora HP $ 200

Ejemplo simple de if :

El siguiente comando leerá el contenido del items.txt archivo y verifique el 3rd valor de campo en cada línea. Si el valor está vacío, imprimirá un mensaje de error con el número de línea.

$awk '{if ($ 3 ==' ') print' Falta el campo de precio en la línea 'NR}'items.txt

Producción:

ejemplo if-else:

El siguiente comando imprimirá el precio del artículo si el 3rdEl campo existe en la línea; de lo contrario, imprimirá un mensaje de error.

$ awk'{if ($ 3 ==' ') print' Falta el campo de precio '
si no, imprime 'el precio del artículo es' $ 3} '
elementos.TXT

Producción:

ejemplo if-else-if:

Cuando el siguiente comando se ejecute desde la terminal, tomará la entrada del usuario. El valor de entrada se comparará con cada condición if hasta que la condición sea verdadera. Si alguna condición se cumple, se imprimirá la calificación correspondiente. Si el valor de entrada no coincide con ninguna condición, la impresión fallará.

$awk 'BEGIN {print' Ingresa la marca: '
marca de línea<'-'
si (marca> = 90) escribe 'A +'
de lo contrario, si (marca> = 80) imprime 'A'
de lo contrario, si (marca> = 70) imprime 'B +'
si no imprime 'Fallo'} '

Producción:

Ir a Contenido

variables awk

La declaración de la variable awk es similar a la declaración de la variable de shell. Hay una diferencia en la lectura del valor de la variable. El símbolo '$' se usa con el nombre de la variable de la shell para leer el valor. Pero no es necesario utilizar '$' con la variable awk para leer el valor.

Usando una variable simple:

El siguiente comando declarará una variable llamada 'sitio' y se asigna un valor de cadena a esa variable. El valor de la variable se imprime en la siguiente declaración.

$awk 'BEGIN {sitio =' LinuxHint.com '; sitio de impresión} '

Producción:

Usar una variable para recuperar datos de un archivo

El siguiente comando buscará la palabra 'Impresora' en el archivo items.txt . Si alguna línea del archivo comienza con 'Impresora ', Entonces almacenará el valor de 1S t , 2Dakota del Norte y 3rd campos en tres variables. nombre y precio se imprimirán las variables.

$ awk'/ Impresora / {nombre = $ 1; marca = $ 2; precio = $ 3; imprimir' nombre del artículo = 'nombre;
imprimir 'precio del artículo =' precio} '
elementos.TXT

Producción:

Ir a Contenido

matrices awk

Tanto las matrices numéricas como las asociadas se pueden usar en awk. La declaración de variables de matriz en awk es la misma que en otros lenguajes de programación. En esta sección se muestran algunos usos de las matrices.

Matriz asociativa:

El índice de la matriz será cualquier cadena para la matriz asociativa. En este ejemplo, se declara e imprime una matriz asociativa de tres elementos.

$awk 'EMPEZAR {
libros ['Diseño web'] = 'Aprendiendo HTML 5';
libros ['Programación web'] = 'PHP y MySQL'
libros ['PHP Framework'] = 'Aprendiendo Laravel 5'
printf '% s n% s n% s n', libros ['Diseño web'], libros ['Programación web'],
libros ['PHP Framework']} '

Producción:

Matriz numérica:

Una matriz numérica de tres elementos se declara e imprime separando la pestaña.

$ awk'EMPEZAR {
número [0] = 80;
número [1] = 55;
número [2] = 76;

# imprimir elementos de matriz
printf 'Valores de matriz:% d t%D t%D orte', número [0], número [1], número [2]; } '

Producción:

Ir a Contenido

bucle awk

Awk admite tres tipos de bucles. Los usos de estos bucles se muestran aquí mediante tres ejemplos.

Mientras que bucle:

Mientras que el bucle que se usa en el siguiente comando se repetirá 5 veces y saldrá del bucle para la declaración de ruptura.

$ awk 'COMIENZO {n = 1; mientras que (n 5) se rompe; imprimir n; n ++}} '

Producción:

En bucle:

El bucle for que se utiliza en el siguiente comando awk calculará la suma de 1 a 10 e imprimirá el valor.

$awk 'COMIENZO {suma = 0; para (n = 1; n<= 10; n++) sum=sum+n; print sum }'

Producción:

Bucle de hacer mientras:

un ciclo do-while del siguiente comando imprimirá todos los números pares del 10 al 5.

$awk 'COMIENZO {contador = 10; hacer {if (contador% 2 == 0) imprimir contador; encimera-- }
while (contador> 5)} '

Producción:

Ir a Contenido

awk para imprimir la primera columna

La primera columna de cualquier archivo se puede imprimir usando la variable $ 1 en awk. Pero si el valor de la primera columna contiene varias palabras, solo se imprime la primera palabra de la primera columna. Al utilizar un delimitador específico, la primera columna se puede imprimir correctamente. Crea un archivo de texto llamado estudiantes.txt con el siguiente contenido. Aquí, la primera columna contiene el texto de dos palabras.

Students.txt

Kaniz Fatema 30thlote
Abir Hossain 35thlote
John Abraham 40thlote

Ejecute el comando awk sin ningún delimitador. Se imprimirá la primera parte de la primera columna.

$awk '{imprimir $ 1}'estudiantes.txt

Ejecute el comando awk con el siguiente delimitador. Se imprimirá la parte completa de la primera columna.

$awk -F '\ s \ s' '{imprimir $ 1}'estudiantes.txt

Producción:

Ir a Contenido

awk para imprimir la última columna

$ (NF) La variable se puede utilizar para imprimir la última columna de cualquier archivo. Los siguientes comandos awk imprimirán la última parte y la parte completa de la última columna de los estudiantes.txt expediente.

$awk '{print $ (NF)}'estudiantes.txt
$awk -F '\ s \ s' '{print $ (NF)}'estudiantes.txt

Producción:

Ir a Contenido

awk con grep

grep es otro comando útil de Linux para buscar contenido en un archivo basado en cualquier expresión regular. En el siguiente ejemplo se muestra cómo se pueden usar juntos los comandos awk y grep. sujeción El comando se usa para buscar información de la identificación del empleado, ' 1002 ' de el empleado.txt expediente. La salida del comando grep se enviará a awk como datos de entrada. La bonificación del 5% se contará e imprimirá en función del salario de la identificación del empleado, ' 1002’ por comando awk.

$gatoemployee.txt
$sujeción '1002'employee.txt| awk -F ' t' '{print $ 2' obtendrá $ '($ 3 * 5) / 100' bonus '}'

Producción:

Ir a Contenido

awk con archivo BASH

Al igual que otros comandos de Linux, el comando awk también se puede usar en un script BASH. Crea un archivo de texto llamado clientes.txt con el siguiente contenido. Cada línea de este archivo contiene información sobre cuatro campos. Estos son el ID del cliente, el nombre, la dirección y el número de teléfono móvil que están separados por ‘/ ’.

clientes.txt

AL4934 / Charles M Brunner / 4838 Beeghley Street, Huntsville, Alabama / 256-671-7942
CA5455 / Virginia S Mota / 930 Bassel Street, VALLECITO, California / 415-679-5908
IL4855 / Ann A Neale / 1932 Patterson Fork Road, Chicago, Illinois / 773-550-5107

Crea un archivo bash llamado item_search.bash con el siguiente script. Según este script, el valor de estado se tomará del usuario y se buscará en los clientes.txt archivar por sujeción comando y se pasa al comando awk como entrada. El comando Awk leerá 2Dakota del Norte y 4th campos de cada línea. Si el valor de entrada coincide con cualquier valor de estado de clientes.txt archivo, luego imprimirá el archivo del cliente nombre y número de teléfono móvil , de lo contrario, imprimirá el mensaje Ningún cliente encontrado .

item_search.bash

#! / bin / bash
echo 'Ingrese el nombre del estado:'
leerestado
clientes=`sujeción '$ estado'clientes.txt| awk -F '/' '{print' Nombre del cliente: '$ 2,',
Número de móvil: '$ 4}'
`
si [ '$ clientes' !='' ];luego
echo $ clientes
demás
echo 'No se encontró ningún cliente'
ser

Ejecute los siguientes comandos para mostrar las salidas.

$gatoclientes.txt
$intentoitem_search.bash

Producción:

Ir a Contenido

awk con sed

Otra herramienta de búsqueda útil de Linux es sed . Este comando se puede utilizar tanto para buscar como para reemplazar texto de cualquier archivo. El siguiente ejemplo muestra el uso del comando awk con sed mando. Aquí, el comando sed buscará todos los nombres de los empleados que comiencen con ' J 'Y pasa al comando awk como entrada. awk imprimirá empleado nombre y IDENTIFICACIÓN después de formatear.

$gatoemployee.txt
$sed -norte '/ J / p'employee.txt| awk -F ' t' '{printf'% s (% s) n ', $ 2, $ 1}'

Producción:

Ir a Contenido

Conclusión:

Puede usar el comando awk para crear diferentes tipos de informes basados ​​en cualquier dato tabular o delimitado después de filtrar los datos correctamente. Espero que puedas aprender cómo funciona el comando awk después de practicar los ejemplos que se muestran en este tutorial.