本文介绍了如何通过R中的用户定义语句过滤元数据?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
在R中有一个名为 sFilter
的函数来过滤元数据。但是,是旧的(版本:0.5-10 )tm包。有没有什么功能,而不是在新版本? 我的代码块是;
query< - LEWISSPLIT =='TRAIN'
trainData< - tm_filter(语料库,FUN = sFilter,查询)
这意味着,获取在LEWISSPLIT属性中具有TRAIN值的文档。
< REUTERS TOPICS = ?? LEWISSPLIT =& CGISPLIT =& OLDID =& NEWID = ??>
解决方案
$ b $ pre $
trainData
这是从例子(tm_filter) / code>。有一个例子使用
grep()
来进行更灵活的搜索。
There is a function called sFilter
in R to filter meta data. However, the function is an old (Version: 0.5-10) tm package. Is there any function instead of it in a new version?
My code block is;
query <- "LEWISSPLIT == 'TRAIN'"
trainData <- tm_filter(Corpus, FUN = sFilter, query)
It means, get documents which have "TRAIN" value in their LEWISSPLIT attribute.
<REUTERS TOPICS=?? LEWISSPLIT=?? CGISPLIT=?? OLDID=?? NEWID=??>
解决方案
Just write your own filtering function:
trainData <- tm_filter(Corpus, FUN = function(x, qry) any(meta(x)["lewissplit"] == qry), "TRAIN")
This was adapted from example(tm_filter)
. There is an example using grep()
for more flexible search.
这篇关于如何通过R中的用户定义语句过滤元数据?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!