版权申明:本文为博主窗户(Colin Cai)原创,欢迎转帖。如要转贴,必须注明原文网址 http://www.cnblogs.com/Colin-Cai/p/7222794.html 作者:窗户 QQ:6679072 E-mail:[email protected]
UNIX/LINUX下有个工具叫sed,起源于ed命令,但没有人机交互,完全是脚本语言。sed虽然是结构化的程序,但其虚拟出来的机器与我们实际机器相差甚远,依靠模式空间和保留空间的交替使用、正则表达式不断替换达到处理的目的。
sed有相当一部分粉丝,就如同lisp那样,因为与众不同,而用sed写出sed不擅长的事情是粉丝的追求,似乎这种方式很有黑客精神的感觉,其实很屌丝。
这个网址叫the sed $HOME,里面汇聚了很多精英脚本,一个个神一样的sed脚本啊。
http://sed.sourceforge.net/grabbag/scripts/dc.sed
the sed $HOME 里面的上面这个脚本,被我们当成是sed的终极脚本,脚本十分诡异,实现了一个dc计算器(UNIX下的一个基于逆波兰式的任意精度计算器),我曾试图读懂它,但不得不说,sed程序的确不是拿来给人读的。
我也曾经是sed粉丝中的一员,无论什么样的文本处理,我都希望尝试着用sed去写。
翻以前在论坛里的帖子,我曾经出过一道用sed题目:
得出一行中最大的数
比如
00123xdsd0176ddsdw201eew
得出201
19为其位置
sed里面没有任何直接的数学运算,此类问题都需要给诡异的技巧。我给了一个解答如下:
#!/usr/bin/sed -rnf
/[-]/!d
s/[^-]/ /g
s/$/ /
tloop
:loop
s/^( *)([-]+)( +)([-]+)( .*)$/\1b\2e\3b\4e\/
tmain h
s/[-].*/ /
s/.//g
:cnt
s/(^|;)/;/g
tcnt
s///g
s///g
s///g
s///g
s///g
s///g
s///g
s///g
:zero
s/;;/;;/g
tzero
s/(^$)|;$//
s/;//g
G
tend
:end
s/(.*)\n *([-]+).*$/\ \/
tend2
d
:end2
p
d :main
s/b(+)/\1b/g
h
:a
s/(bf*)[-]/\1f/
ta
/(bf*)e.*\1f/ {
:e
g
:b
s/[-]([-]*b.*b)/ \/
tb
:B
s/(b *)[-](.*b)/\ \/
tB
s/[be]//g
tloop
}
s/(bf*e)(.*)(bf*e)/\\/
/(bf*)e.*\1f/ {
:f
g
:c
s/(e.* )[-]([-]*b)/\ \/
tc
:C
s/(b *)[-]([^b]+)$/\ \/
tC
s/[be]//g
tloop
}
g
:d
/b(.).*b\/! {
/b(.).*b(.).*\[-]*\[-]*$/be
bf
} s/b([-])(.*)b([-])/\1b\\3b/
td
be
看了看,几年之前的代码居然也大致看懂了。随着论坛的衰落,现在没有这个心境写sed了,突然有些怀念以前。