我想知道R的文本挖掘程序包是否具有以下功能:
myCorpus <- Corpus(DirSource(<directory-contatining-textfiles>),control=...)
# add docs
myCorpus.addDocs(DirSource(<new-dir>),control=...)
理想情况下,我想将其他文档合并到现有语料库中。
任何帮助表示赞赏
最佳答案
您应该可以像下面那样使用c(,)
> library(tm)
> data("acq")
> data("crude")
> together <- c(acq,crude)
> acq
A corpus with 50 text documents
> crude
A corpus with 20 text documents
> together
A corpus with 70 text documents
您可以在
tm_combine
下的tm package documentation中找到更多信息。关于r - R文本挖掘包: Allowing to incorporate new documents into an existing corpus,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/6616805/