基本用法:

awk '{print $0}' demo.txt

或者管道符方式:

netstat | awk '{print $0}'

其中单引号中被大括号括着的就是 awk 语句,注意,其只能被单引号包含。

内建变量:

变量描述
$0当前记录(这个变量中存放着整个行的内容)
$1~$n当前记录的第n个字段,字段间由FS分隔
FS输入字段分隔符 默认是空格或Tab
NF当前记录中的字段个数,就是有多少列
NR已经读出的记录数,就是行号,从1开始,如果有多个文件话,这个值也是不断累加中。
FNR当前记录数,与NR不同的是,这个值会是各个文件自己的行号
RS输入的记录分隔符, 默认为换行符
OFS输出字段分隔符, 默认也是空格
ORS输出的记录分隔符,默认为换行符
FILENAME当前输入文件的名字

常用

输出第一列和第四列:

netstat | awk '{print $1, $4}'

变量NF表示当前行有多少个字段,因此$NF就代表最后一个字段。

netstat | awk '{print $NF}'

$(NF-1)代表倒数第二个字段。

netstat | awk '{print $1, $(NF-1)}'

第三列的值为 0 && 第 6 列的值为 LISTEN,其中的 == 为比较运算符。其他比较运算符:!=, >, <, >=, <=

netstat | awk '$3==0 && $6=="LISTEN"'

第三列大于 0 的所有行:

netstat | awk '$3>0 {print $0}'

-F 的意思是指定分隔符,如果要指定多个分隔符,可以这样来:awk -F '[;:]'

cat /etc/passwd | awk  -F: '{print $1,$3,$6}' OFS="\t"

~ 表示模式开始。/ / 中是模式。下面的例子是一个正则表达式的匹配模式:

netstat | awk '$6 ~ /WAIT/ || NR==1 {print NR,$4,$5,$6}' OFS="\t"

我们可以使用 /FIN|TIME/ 来匹配 FIN 或者 TIME :

netstat | awk '$6 ~ /FIN|TIME/ || NR==1 {print NR,$4,$5,$6}' OFS="\t"

再来看看模式取反的例子:

netstat | awk '$6 !~ /WAIT/ || NR==1 {print NR,$4,$5,$6}' OFS="\t"

awk 拆分文件很简单,使用重定向就好了。下面这个例子,是按第 6 列分隔文件(其中的 NR!=1 表示不处理表头)。

netstat | awk 'NR!=1{print > $6}'

也可以把指定的列输出到文件:

netstat | awk 'NR!=1{print $4,$5 > $6}'

下面的命令计算所有的C文件,CPP文件和H文件的文件大小总和。

ls -l  *.cpp *.c *.h | awk '{sum+=$5} END {print sum}'

我们再来看一个统计各个 connection 状态的用法:(我们可以看到一些编程的影子了,大家都是程序员我就不解释了。注意其中的数组的用法)

netstat | awk 'NR!=1{a[$6]++;} END {for (i in a) print i ", " a[i];}'

再来看看统计每个用户的进程的占了多少内存:

ps aux | awk 'NR!=1{a[$1]+=$6;} END { for(i in a) print i ", " a[i]"KB";}'

从 file 文件中找出长度大于 80 的行:

awk 'length>80' file

按连接数查看客户端 IP:

netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -nr