我正在尝试使用R包topicmodels进行一些主题建模

按照R text file and text mining...how to load data这些说明,我已经使用'tm'软件包进行了预处理。

但是,当我使用R中的topicmodels运行我的相关主题模型(CTM)时,出现以下错误

 "Error in CTM...DocumentTermMatrix needs to have a term frequency weighting.

我已经三重检查了DocumentTermMatrix的结构,它的确具有频率加权:
 A document-term matrix (26 documents, 413 terms)

 Non-/sparse entries: 4804/5934
 Sparsity           : 55%
 Maximal term length: 13
 Weighting          : term frequency - inverse document frequency (normalized) (tf-idf)

任何有关如何使这项工作的建议将不胜感激!

最佳答案

如果之前使用slam软件包,则需要将weighting参数指定为weightTf:

m=as.simple_triplet_matrix(mm);
dtm <- as.DocumentTermMatrix(m,weighting =weightTf)

10-04 15:15