对任意一门语言都会有变量,在awk中变量分为内置变量自定义变量

内置变量

awk主要的内置变量如下所示:

\$0代表当前整行记录
$\(1-\$\)n代表当前一行的第n列,由输入分隔符决定默认由空格进行分隔
FS输入列分隔符默认为空格
RS输入行分隔符默认为换行符
ORS输出行分隔符默认为换行符
OFS输出列分隔符默认为空格
NF当前行总列数
NR当前处理的文本行号
FNR各文件自己的行号
FILENAME当前文件名
ARGC命令行的参数个数
ARGV命令行中数组的参数
CONVFMT设置数字的格式默认%.6g
OFMT输出数字的格式默认%.6g

用法示例

1、打印行号

awk基础02-变量-分隔符-数组-LMLPHP

2、awk默认以换行符做为新的一行的开始,如果不想采用默认的换行符,则可以自己指定行分隔符

awk基础02-变量-分隔符-数组-LMLPHP

3、awk在输出显示时也是默认以换行符作为新的一行,如果在输出不采用默认的换行符,则也可指定输出行分隔符

awk基础02-变量-分隔符-数组-LMLPHP

4、打印总列数和行号

awk基础02-变量-分隔符-数组-LMLPHP

5、如果一次输入有多个文件,想打印各个文件自己的信息,如何处理?来看示例:

awk基础02-变量-分隔符-数组-LMLPHP

自定义变量

    内置变量个数是有限的,不能满足现实中不同的使用场景,因此在实际应用时,还需要定义自己的变量,俗称自定义变量。在awk中自定义变量的方法主要有两种方式:

  • 方式一:通过选项-v
awk -v variableName=value
  • 方式二:在模式中定义
awk 'BEGIN {variableName=value}'

用法示例

awk基础02-变量-分隔符-数组-LMLPHP

分隔符

  • 问题一:awk默认是逐行处理文本,在将文本读入后,只想输出某些用户想要的信息,怎么处理?
  • 问题二:在匹配到相应的数据后,要对输出进行格式化处理,如两个字段问采用%%连接,怎么处理?

    针对以下两个问题,我们引入分隔符概念。在awk中,分隔符分为两种:输入分隔符输出分隔符

输入分隔符

    输入分隔符,全称field separator,简写FS。针对即将读入到awk中所采用的分隔符,默认为空格;当awk逐行处理文本文件的时候,以输入分隔符为参考对每行进行切割并分隔为多列。如果文本文件中没有空格,则可以自行指定分隔符。

  • 通过选项 -F 指定输入分隔符

awk基础02-变量-分隔符-数组-LMLPHP

  • 通过 -v 设置内部变量 FS,指定输入分隔符

awk基础02-变量-分隔符-数组-LMLPHP

输出分隔符

    输出分隔符,全称output field separator,简写OFS。针对经过awk处理后,在输出的时候采用的分隔符加以格式化,默认为空格。如果在输出的结果不采用默认的分隔符,则需要指定分隔符。

  • 通过 -v 设置内部变量 OFS,指定输入分隔符

awk基础02-变量-分隔符-数组-LMLPHP

  • 使用print输出

awk基础02-变量-分隔符-数组-LMLPHP

数组

    如果你了解过任何一门编程语言,则很容易明白什么是数组。通过情况下,数组是代表同一种类型数据的集合,常用的有一维、二维和多维数组等等。在使用的时候通过数组下标去访问。大部分的编程语言中下标是从0开始,而awk中数组下标是从1开始。在使用数组时需要注意的事项如下所示:

  • 数组的允许赋空值
  • 如果引用的数组值不存在,则系统默认会创建并赋为空值
  • awk中数组的下标可以是数字,也可以是任意字符
  • 判断元素是否属于数组需要使用(元素 in 数组)
  • 如果引用的元素不存在,进行数值运算时会默认当0进行处理

用法示例

awk基础02-变量-分隔符-数组-LMLPHP

本文同步在微信订阅号上发布,如各位小伙伴们喜欢我的文章,也可以关注我的微信订阅号:woaitest,或扫描下面的二维码添加关注:

awk基础02-变量-分隔符-数组-LMLPHP

05-11 13:22