我不知道如何诚实地修剪文字。
到目前为止我所拥有的:
wget --output-document=- http://www.geupdate.com 2>/dev/null \
| grep last \
输出:
<li><b><img src='http://www.geupdate.com/img/arrow-tail.png' align='left'>Time since last update</b>: <br />0 day, 19 hours, 23 min, 36 sec</li><li><b><img src='http://www.geupdate.com/img/ledlightblue.png' align='left'>An Update to occur within:</b> (<a href='http://www.geupdate.com/update-prediction/'><font size='-2'>?</font></a>) <br />0 day, 21 hours, 56 min, 30 sec</li> </ul>
我真正想删掉的是:
0 day, 19 hours, 23 min, 36 sec
如果有人能告诉我怎么写,或者写得这么简单,那就太好了!
当我运行这个时:
wget --output-document=- http://www.geupdate.com 2>/dev/null \
| grep last \
| grep -o '[[:digit:]]* day.* sec'
我明白了:
0 day, 19 hours, 43 min, 16 sec</li><li><b><img src='http://www.geupdate.com/img/ledlightblue.png' align='left'>An Update to occur within:</b> (<a href='http://www.geupdate.com/update-prediction/'><font size='-2'>?</font></a>) <br />0 day, 21 hours, 36 min, 50 sec
最佳答案
wget --output-document=- http://www.geupdate.com 2>/dev/null \
| grep last \
| grep -o '[[:digit:]]* days*, [[:digit:]]* hours*, [[:digit:]]* min, [[:digit:]]* sec' \
| head -1
关于linux - Shell脚本从网页提取文本并修剪,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/8283122/