2.Linux 文件管理命令

2.44 awk:模式匹配语言

  • 作用:利用一组用户提供的命令来将一组文件和用户提供的扩展正则表达式进行比较,一 次一行,然后在任何与扩展正则表达式匹配的行上执行操作。

  • 用法:

    awk [options] 'script' var=value file(s)

    awk [options] -f scriptfile var=value file(s)

主要选项如下:

awk 脚本是由模式和操作组成的,即 pattern {action},如$ awk ‘/root/’ test,$ awk ‘$3 < 100’ test。二者是可选的,如果没有模式,则 action 应用到全部记录;如果没有 action,则输出匹配 全部记录。在默认情况下,每一个输入行都是一条记录,但用户可通过 RS 变量指定不同的分 隔符进行分隔。

awk 是 Linux 下的一个命令,它对其他命令的输出、对文件的处理都十分强大。其实它更 像一门编程语言,可以自定义变量,有条件语句,有循环,有数组,有正则,有函数等。它读 取输出或者文件的方式是一行一行地读,根据用户给出的条件进行查找,并在找出的行中进行 操作,感觉它的设计思想真的很简单,但是结合实际情况,具体操作起来就没有那么简单了。 它有 3 种形式:awk,gawk,nawk,平时所说的 awk 其实就是 gawk。

1.变量

变量及其描述如表
Linux 文件管理命令Lawk wc comm join fmt-LMLPHP

2.运算符

运算符及其描述如表

Linux 文件管理命令Lawk wc comm join fmt-LMLPHP

3.awk 的正则

匹配符及其描述如表

Linux 文件管理命令Lawk wc comm join fmt-LMLPHP

4.字符串函数

字符串函数及其描述如表

Linux 文件管理命令Lawk wc comm join fmt-LMLPHP

5.数学函数

数学函数及其返回值如表

Linux 文件管理命令Lawk wc comm join fmt-LMLPHP

案例练习

(1)显示文件 hello.c 中的行号和第三字段。

#awk '{printf"%03d%s\n",NR,$1}' hello.c 
001/* 
002#include 
003int 
004{ 
005printf("Hello, 
006return 
007}

(2)显示长于 7 个字符的文件的行。

# awk 'length >7' hello.c 
/* hello.c - Canonical "Hello, World!" program */ 
#include <stdio.h> 
int main(void) 
 printf("Hello, Linux programming world!\n"); 
 return 0;

(3)以相反顺序打印前两个字段。

awk 'length >7' hello.c 
/* hello.c - Canonical "Hello, World!" program */ 
#include <stdio.h> 
int main(void) 
 		printf("Hello, Linux programming world!\n");
 		return 0; 
[root@localhost tmp]# awk '{ print $2, $1 }' hello.c 
hello.c /* 
<stdio.h> #include 
main(void) int 
{ 
Linux printf("Hello, 
0; return 
}

2.45 wc:输出文件中的行数、单词数、字节数

  • 作用:对每个文件输出行、单词和字节统计数,如果指定了多于一个文件,则还有一个行数的总计。如果指定的文件是“-”,则读取标准输入。

  • 用法:wc [选项]…[文件]

  • 主要选项如下。

    主要选项如下:

    案例练习

    显示文件 hello.c 中的单词数。

    # wc -w hello.c 
    20 hello.c
    

2.46 comm:比较排序文件

  • 作用:逐行比较两个已排序的文件。

  • 用法:comm [选项]...文件 1 文件 2

  • 主要选项如下

如果不附带选项,程序会生成三列输出。第一列包含文件 1 特有的行,第二列包含文件 2 特有的行,而第三列包含两个文件共有的行。

案例练习

比较排序 FILE1 和 FILE2,共有部分不显示。

comm -3 FILE1 FILE2 
SSSS 
222 

2.47 join:将两个文件中指定栏位内容相同的行连接起来

  • 作用:找出两个文件中指定栏位内容相同的行并加以合并,再输出到标准输出设备。
  • 用法:join [选项]文件 1 文件 2
  • 主要选项如下

针对每一对具有相同内容的输入行,整合为一行写到标准输出,默认的内容连接区块是由 第一个空白符代表的分界符号。当文件 1 或文件 2 都被指定为“-”时,程序将从标准输入读 取数据。

2.48 fmt:编排文本文件

  • 作用:从指定的文件里读取内容,将其按照指定格式重新编排后,输出到标准输出设备。

    若指定的文件名为“-”,则 fmt 命令会从标准输入设备读取数据。

  • 用法:fmt [-宽度] [选项]… [文件]…

    重新格式化文件中的每个段落并输出到标准输出。

    选项“-宽度”是“–width=数字”的缩写。

  • 主要选项如下。

    长选项必须使用的参数对于短选项也是必须使用的。

    应用实例如下。

    重新排版 hello.c 文件。

    # fmt hello.c 
    /* hello.c - Canonical "Hello, World!" program */ #include <stdio.h> 
    int main(void) { 
     	  printf("Hello, Linux programming world!\n"); return 0; 
    } 
    
05-04 09:30