我正在使用java encog机器学习库来运行kmeans集群。问题是仅在数字数据上才有可能。有没有一种方法可以对文本文件(数据)进行矢量化处理,以便直接输入kmeans聚类算法。

我是这个领域的新手。任何帮助表示赞赏。

最佳答案

尝试使用对象输出流
如下

ByteArrayOutputStream baos = new ByteArrayOutputStream();
ObjectOutputStream oos = new ObjectOutputStream(baos);
oos.writeObject("YOUR_TEXT");
oos.close();

10-07 16:35