转自:http://book.51cto.com/art/201303/385961.htm

在读者正觉得正则表达式已经复杂得不能再复杂时,又会发现POSIX规范将正则表达式的实现方法分为了两种:基本正则表达式(BRE)和扩展正则表 达式(ERE)。到目前为止,我们所讨论的正则表达式的所有特性,都得到了兼容POSIX的应用程序的支持,并且都是以BRE的方式实现。grep命令就 是这样的一个例子。

BRE和ERE到底有什么区别?其实仅仅是元字符的不同!在BRE方式中,只承认^ 、$、 . 、[ 、] 、*这些是元字符,所有其他的字符都被识别为文字字符。而ERE中,则添加了(、 ) 、{ 、} 、?、 + |、等元字符(及其相关功能)。

然而(也是有趣的部分),只有在用反斜杠进行转义的情况下,字符(、)、{、}才会在BRE被当作元字符处理,而ERE中,任何元符号前面加上反斜杠反而会使其被当作文字字符来处理。

由于下面要讨论的特性是ERE的一部分,所以需要使用不一样的grep。传统上,这是由egrep程序来执行的,但是GNU版本的grep可以运用-E选项以支持ERE方式。

POSIX

在20世纪80年代,UNIX成为一款非常受欢迎的商业操作系统,但是直到1988年,UNIX世界仍然一片混乱。许多电脑制造商从UNIX的创造 者AT&T获得了 UNIX源代码授权,并且都发行了不同版本的操作系统产品。然而,制造商在努力追求产品差异化的同时,每个制造商都增加了自己专用的变化以及扩展,这就渐 渐限制了软件的兼容性。由于一直由专有厂商销售,所以每一个厂商都想尽办法锁定它们的客户群。UNIX史上的这段黑暗时期被大家称之为"割据时代"。

接着,我们进入了IEEE(Institute of Electrical and Electronics Engineers)时代。在20世纪80年代中期,IEEE开始开发一套规范UNIX和类UNIX系统工作方式的标准。这些标准,官方名称是IEEE 1003,定义了应用程序接口(API)、shell以及一些实用程序,它们可以在标准类UNIX系统中找到。该标准由Richard Stallman提议命名为POSIX,它是Portable Operating System Interface(末尾增加X只是为了更流畅)的缩写,后来被IEEE采纳。

05-18 17:14