我在一行有以下数据:
<a href="#page-metadata-start" class="assistive">Go to start of metadata</a>
<div id="page-metadata-end" class="assistive"></div>
<fieldset class="hidden parameters">
<input type="hidden" title="browsePageTreeMode" value="view">
</fieldset>
<div class="wiki-content">
<p>(openissues)81(/openissues)</p><p>(assignstoday)0(/assignstoday)</p><p>(assignsweek)2(/assignsweek)</p><p>(replyissues)6(/replyissues)</p><p>(wrapissues)26(/wrapissues)</p>
</div>
例如,我想获取“openissues”的值,但我无法找到正确的检索方法。我试过的其中一个命令是:
sed -n '/(assignstoday)/,/(\/assignstoday)/p' ~/test.txt
有什么帮助吗?
最佳答案
sed 's/.*(openissues)\(.*\)(\/openissues).*/\1/' test.txt
一个快速的黑客可能满足您的编辑要求:
sed -n '/openissues/p' test.txt | sed 's/.*(openissues)\(.*\)(\/openissues).*/\1/'
但在解析html时,regex并不是真正的方法。