我不能用weka库处理集群。我具有字符串属性,因此我使用StringToWordVector过滤器,但是在聚类后如何从WordVector移回字符串表示形式以显示“人类可读”的结果?我要还原此操作:StringToWordVector filter = new StringToWordVector();filter.setInputFormat(instancesToFilter);Instances dataFiltered = Filter.useFilter(instancesToFilter, filter);有可能吗? 最佳答案 StringToWordVector过滤器不能反转。但是,您至少有两种可能性:如果只想查看或显示每个群集中的原始字符串,则可以添加ID属性,确保在群集期间不使用该属性(以避免意外的行为),然后从原始字符串中恢复文本(文件)。如果要显示每个群集的内容的一些有意义的摘要,可以只输出每个群集中最频繁/最繁琐的单词。在对文本进行聚类时,这是一种相当常见的方法。关于java - weka StringToWordVector过滤器还原(java),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/21260583/
10-12 22:42