本文介绍了如何通过R中的用户定义语句过滤元数据?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

在R中有一个名为 sFilter 的函数来过滤元数据。但是,是旧的(版本:0.5-10 )tm包。有没有什么功能,而不是在新版本?



我的代码块是;

  query<  - LEWISSPLIT =='TRAIN'
trainData< - tm_filter(语料库,FUN = sFilter,查询)

这意味着,获取在LEWISSPLIT属性中具有TRAIN值的文档。

 < REUTERS TOPICS = ?? LEWISSPLIT =& CGISPLIT =& OLDID =& NEWID = ??> 


解决方案

$ b $ pre $ trainData

这是从例子(tm_filter) / code>。有一个例子使用 grep()来进行更灵活的搜索。


There is a function called sFilter in R to filter meta data. However, the function is an old (Version: 0.5-10) tm package. Is there any function instead of it in a new version?

My code block is;

query <- "LEWISSPLIT == 'TRAIN'"
trainData <- tm_filter(Corpus, FUN = sFilter, query)

It means, get documents which have "TRAIN" value in their LEWISSPLIT attribute.

<REUTERS TOPICS=?? LEWISSPLIT=?? CGISPLIT=?? OLDID=?? NEWID=??>
解决方案

Just write your own filtering function:

trainData <- tm_filter(Corpus, FUN = function(x, qry) any(meta(x)["lewissplit"] == qry), "TRAIN")

This was adapted from example(tm_filter). There is an example using grep() for more flexible search.

这篇关于如何通过R中的用户定义语句过滤元数据?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

08-06 07:05