我正在尝试使用R包topicmodels
进行一些主题建模
按照R text file and text mining...how to load data这些说明,我已经使用'tm'软件包进行了预处理。
但是,当我使用R中的topicmodels
运行我的相关主题模型(CTM)时,出现以下错误
"Error in CTM...DocumentTermMatrix needs to have a term frequency weighting.
我已经三重检查了DocumentTermMatrix的结构,它的确具有频率加权:
A document-term matrix (26 documents, 413 terms)
Non-/sparse entries: 4804/5934
Sparsity : 55%
Maximal term length: 13
Weighting : term frequency - inverse document frequency (normalized) (tf-idf)
任何有关如何使这项工作的建议将不胜感激!
最佳答案
如果之前使用slam软件包,则需要将weighting参数指定为weightTf:
m=as.simple_triplet_matrix(mm);
dtm <- as.DocumentTermMatrix(m,weighting =weightTf)