Un ejemplo más complejo AWK

Aquí tienes un ejemplo para darte una idea de lo que puede hacer un programa awk típico. Este programa muestra como awk puede ser usado para sumarizar, seleccionar y relocalizar la salida de otra utilidad. En el ejemplo se usan características que no han sido todavía explicadas, así que no te preocupes si no entiendes todos los detalles.

ls -l | awk '$5 == "Nov" { sum += $4 }
END { print sum }'

Este comando imprime el número total de bytes de todos los ficheros del directorio actual que fueron modificados por última vez en Noviembre (de cualquier año). (En el C Shell necesitarás teclear un punto y coma y después una barra invertida al final de la primera línea; en el Shell de Bourne o el Shell Bourne-Again puedes teclear el ejemplo tal y como se muestra).

La parte de este ejemplo `ls –l` es un comando que te da un listado completo de todos los ficheros de un directorio, incluyendo el tamaño del fichero y la fecha. La salida es algo como lo siguiente:

-rw-r--r-- 1 close 1933 Nov 7 13:05 Makefile
-rw-r--r-- 1 close 10809 Nov 7 13:03 gawk.h
-rw-r--r-- 1 close 983 Apr 13 12:14 gawk.tab.h
-rw-r--r-- 1 close 31869 Jun 15 12:20 gawk.y
-rw-r--r-- 1 close 22414 Nov 7 13:03 gawk1.c
-rw-r--r-- 1 close 37455 Nov 7 13:03 gawk2.c
-rw-r--r-- 1 close 27511 Dec 9 13:07 gawk3.c
-rw-r--r-- 1 close 7989 Nov 7 13:03 gawk4.c

El primer campo presenta los permisos de lectura-escritura, el segundo campo contiene los enlaces al fichero, y el tercer campo identifica al propietario del fichero. El cuarto campo contiene el tamaño del fichero en bytes. Los campos quinto, sexto y séptimo contienen el mes, el día y la hora, respectivamente, en la cual el fichero fue modificado por última vez. Finalmente, el octavo campo contiene el nombre del fichero.

La expresión $5==”Nov” de tu programa awk es una expresión que chequea si el quinto campo de la salida generada por ‘ls –l’ es igual a ‘Nov’. Cada vez que una línea presenta la cadena ‘Nov’ en su quinto campo, se realiza la acción `{ sum += $4 }'. Esto añade el cuarto campo (el tamaño del fichero) a la variable sum. Como resultado, cuando awk ha finalizado la lectura de líneas de entrada, sum es la suma de los tamaños de los ficheros cuyas líneas contuvieron el patrón.

Después de que la última línea de la salida generada por ls haya sido procesada, se ejecuta la regla END, y el valor de la variable SUM se imprime. En este ejemplo, el valor de sum sería 80600.

Estas técnicas de awk más avanzadas serán cubiertas en secciones posteriores. (Ver la sección 7. Acciones: Overview). Antes de enseñarte la programación de awk más avanzada, debes saber como awk interpreta tu entrada y visualiza tu salida. Manipulando campos y usando sentencia print, puedes producir algunos informes muy útiles y de apariencia espectacular.

Publicar un comentario

0 Comentarios