我想知道R的文本挖掘程序包是否具有以下功能:

myCorpus <- Corpus(DirSource(<directory-contatining-textfiles>),control=...)
# add docs
myCorpus.addDocs(DirSource(<new-dir>),control=...)

理想情况下,我想将其他文档合并到现有语料库中。

任何帮助表示赞赏

最佳答案

您应该可以像下面那样使用c(,)

> library(tm)
> data("acq")
> data("crude")
> together <- c(acq,crude)
> acq
A corpus with 50 text documents
> crude
A corpus with 20 text documents
> together
A corpus with 70 text documents

您可以在tm_combine下的tm package documentation中找到更多信息。

关于r - R文本挖掘包: Allowing to incorporate new documents into an existing corpus,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/6616805/

10-12 17:55
查看更多