目前,我正在为Mallet关于HMM的荒谬可怜的文档而苦苦挣扎。我已经设法将数据导入实例(从ImportExample.java片段改编而成),而我只是想知道如何将它们用于训练HMM模型。
我首先从创建HMM实例开始,但是不确定是否要这样做:



或两次使用相同的数据字母,如下所示:



无论哪种方式,当我去



我收到以下错误:



感谢您提供的任何帮助。

干杯

最佳答案

我设法解决了这个特殊问题,并认为它可能对其他有相同问题的人有用。槌中的示例包中有一个解决方案:http://hg-iesl.cs.umass.edu/hg/mallet/file/83adf71b0824/src/cc/mallet/examples/TrainHMM.java

主要问题与如何通过管道导入数据有关。另外,据我所知,如果您的数据采用以下格式,也会有所帮助:

TOKEN  TAG
TOKEN  TAG

我假设您可以在 token 和标签之间具有功能,但不能百分百确定。如果有人知道在槌中使用HMM的任何好的示例和文档,请告诉我。

关于java - 木槌HMM培训问题,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/7955448/

10-12 20:02