我需要一个简单的脚本在Windows中运行,该脚本在大型xml文件中搜索关键字,然后返回该关键字之前的单词,关键字以及之后的单词。
例如:
“如何提取上下文中的关键字”
我想要:
“提取关键字”
我是一个新手,有足够的知识来返回带有关键字的每一行以及前后的行,但是我为获取需要的单个单词而感到困惑。
有人有什么聪明的主意吗?
最佳答案
这是一种方法:
#!/usr/bin/perl
use 5.12.0;
my $keyword = 'keywords';
while (<DATA>)
{
say for /\b(\S+\s+\b\Q$keyword\E[[:punct:]]*\s+\S+)\b/g;
}
__END__
How can I extract keywords in context, even if there are many keywords to
extract? So many keywords, no idea how to deal with them.