是否有Moses的moses.ini格式的任何文档?在没有参数的情况下在命令行上运行moses会返回可用的功能名称,但不会返回其可用参数。此外,我看到的手册中未指定.ini文件的结构。
最佳答案
主要思想是文件包含翻译模型将使用的设置。因此,应在Moses功能规范中查找moses.ini
中的值和选项的文档。
这是我在网上找到的有关moses.ini
的摘录。
在Moses Core中,我们有一些详细信息:
7.6.5 moses.ini
所有功能功能均在[feature]
部分中指定。应采用以下格式:
* Feature-name key1=value1
key2=value2
...。例如,KENLM factor=0 order=3 num-features=1 lazyken=0 path=file.lm.gz
另外,还提供了有关如何打印有关moses.ini中提到的所有组件的基本统计信息的提示。
运行脚本
analyse_moses_model.pl moses.ini
这有助于设置映射步骤的顺序,以避免翻译选项爆炸,或者仅检查模型组件是否与我们期望的一样大/详细。
在Center for Computational Language and EducAtion Research (CLEAR) Wiki中,有一个带有一些文档的样本文件:
参量
建议制作一个.ini
文件来存储所有设置。
input-factors
-是否使用因子模型
mapping
-在内存(T)中使用LM或直接在硬盘中读取文件(G)
ttable-file
-表示数字。源因子的数量。目标因子,得分数和
转换表文件的路径
lmodel-file
-使用因子号,LM的顺序(n-gram)和语言模型文件的路径来指示用于LM的类型(0:SRILM,1:IRSTLM)
如果还不够,在this page, see "Decoder configuration file" section上还有另一个描述
各节
[ttable-file]
和[lmodel-file]
包含指向短语表的指针
文件和语言模型文件。您可以忽略
这些行上的数字。暂时知道这一点就足够了
语言模型规范中的最后一个数字是
n元语法模型的顺序。
配置文件还包含一些功能权重。注意
[weight-t]
部分有5个权重,每个包含的特征之一
在词组表中。
培训过程创建的moses.ini
文件将无法使用
您的解码器无需修改,因为它依赖一种语言
未编译到我们的解码器中的模型库。为了要做
工作正常,打开moses.ini文件并找到语言模型
[lmodel-file]
标题之后的行中的指定。
这行的第一个数字是0
,代表SRILM。
将其更改为8
,其余部分保持不变。那你的
配置应该工作。
关于machine-learning - Moses的文档(统计机器翻译)mose.ini文件格式?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/30033707/