选自:http://maotong.blog.hexun.com/6261890_d.html

苏统华

哈尔滨工业大学人工智能研究室

2006年10月30日

声明:版权所有,转载请注明作者和来源

该系统能够识别连续说出的数字串和若干组姓名。建模是针对子词(sub-word, eg. 音素),具有一定的可扩充性。当加入一个新名字时,只需修改发音词典和任务语法即可。模型为连续混合高斯输出,运用语音决策树聚类形成的绑定状态式三音素。

4. 识别器评估

[step 11]验证测试结果

用Viterbi算法进行识别已经在前文又多处涉及,这里轻松了,执行如下命令:

HVite -C .\config\config2 -H .\hmms\hmm15\macros -H .\hmms\hmm15\hmmdefs -S test.scp -l * -i .\results\recout_step11.mlf -w wdnet -p 0.0 -s 5.0 .\dict\dict4 .\lists\tiedlist

其中的config2(前文已经提到过)在config基础上加入FORCECXTEXP=T,ALLOWXWRDEXP=F。进行识别验证:

HResults -I .\labels\testwords.mlf .\lists\tiedlist .\results\recout_step11.mlf

所得结果如下:

====================== HTK Results Analysis =======================

Date: Tue Oct 31 10:06:53 2006

Ref : .\labels\testwords.mlf

Rec : .\results\recout_step11.mlf

------------------------ Overall Results --------------------------

SENT: %Correct=93.33 [H=14, S=1, N=15]

WORD: %Corr=100.00, Acc=98.53 [H=68, D=0, S=0, I=1, N=68]

==============================================================

05-07 15:12