1.提出了一种基于特征函数和反向转录文法(ITG)的无监督词对齐模型,使用对数线性
模型对文法规则的概率建模,先验知识可以通过特征函数的形式加入到模型里面,而模型仍
然可以进行无监督训练。
2. 在模型的参数训练方面,本文在模型的优化目标上增加了一个L1正则化因子,使得模型
能学到一个稀疏的解,把文法规则概率集中到了对词对齐有用的文法规则上面,提高了词对
齐的质量。
3. 开发了一个基于ITG的无监督词对齐软件工具,实现了传统的ITG无监督词对齐模型
和基于特征函数的ITG无监督词对齐模型。

本文在词对齐和机器翻译两个方面进行了相关的实验。实验结果表明,本文提出的模型
无论是在词对齐还是在机器翻译方面都优于传统的ITG无监督词对齐模型。

全文链接:

http://files.cnblogs.com/lizhonghua/%E5%9F%BA%E4%BA%8EITG%E7%9A%84%E6%97%A0%E7%9B%91%E7%9D%A3%E8%AF%8D%E5%AF%B9%E9%BD%90%E7%A0%94%E7%A9%B6.pdf

04-28 15:47