目前,我正在为Mallet关于HMM的荒谬可怜的文档而苦苦挣扎。我已经设法将数据导入实例(从ImportExample.java片段改编而成),而我只是想知道如何将它们用于训练HMM模型。
我首先从创建HMM实例开始,但是不确定是否要这样做:
或两次使用相同的数据字母,如下所示:
无论哪种方式,当我去
我收到以下错误:
感谢您提供的任何帮助。
干杯
最佳答案
我设法解决了这个特殊问题,并认为它可能对其他有相同问题的人有用。槌中的示例包中有一个解决方案:http://hg-iesl.cs.umass.edu/hg/mallet/file/83adf71b0824/src/cc/mallet/examples/TrainHMM.java
主要问题与如何通过管道导入数据有关。另外,据我所知,如果您的数据采用以下格式,也会有所帮助:
TOKEN TAG
TOKEN TAG
我假设您可以在 token 和标签之间具有功能,但不能百分百确定。如果有人知道在槌中使用HMM的任何好的示例和文档,请告诉我。
关于java - 木槌HMM培训问题,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/7955448/