我正在尝试开发一种将语音识别中的垃圾与非垃圾分开的系统。我正在使用“隐马尔可夫模型”的jahmm实现。我对应该将训练数据作为观察序列提供给系统的格式感到困惑。 HMM中的每个状态由什么组成?我尝试阅读手册,但听不懂。谢谢

最佳答案

我对应该将训练数据作为观察序列提供给系统的格式感到困惑。


要了解格式,您可以阅读源代码

public <O extends Observation> Hmm<O>
    learn(Hmm<O> initialHmm, List<? extends List<? extends O>> sequences)


建议输入数据必须是观察序列的列表。每个观察序列是一个观察列表。如果您不了解什么是清单,那么对CS进行很好的介绍可以帮助您


  HMM中的每个状态由什么组成?


HMM的状态只是数学结构的元素。它们不包含任何东西。它们具有与之相关的概率分布。您可以在HMM tutorial中找到更多详细信息,在开始使用HMM之前,最好阅读这些详细信息。

该库本身也很好地描述了文档中的所有内容:

http://jahmm.googlecode.com/svn/javadoc/0.6.2/index.html

关于java - 语音识别中HMM的观察序列格式,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/16868014/

10-12 22:26