是否有Moses的moses.ini格式的任何文档?在没有参数的情况下在命令行上运行moses会返回可用的功能名称,但不会返回其可用参数。此外,我看到的手册中未指定.ini文件的结构。

最佳答案

主要思想是文件包含翻译模型将使用的设置。因此,应在Moses功能规范中查找moses.ini中的值和选项的文档。

这是我在网上找到的有关moses.ini的摘录。

Moses Core中,我们有一些详细信息:


  7.6.5 moses.ini所有功能功能均在[feature]部分中指定。应采用以下格式:
  * Feature-name key1=value1 key2=value2...。例如,KENLM factor=0 order=3 num-features=1 lazyken=0 path=file.lm.gz


另外,还提供了有关如何打印有关moses.ini中提到的所有组件的基本统计信息的提示。


  运行脚本
  analyse_moses_model.pl moses.ini
  这有助于设置映射步骤的顺序,以避免翻译选项爆炸,或者仅检查模型组件是否与我们期望的一样大/详细。


Center for Computational Language and EducAtion Research (CLEAR) Wiki中,有一个带有一些文档的样本文件:


  参量
  
  建议制作一个.ini文件来存储所有设置。
  
  input-factors
  -是否使用因子模型
  mapping
  -在内存(T)中使用LM或直接在硬盘中读取文件(G)
  ttable-file
  -表示数字。源因子的数量。目标因子,得分数和
  转换表文件的路径
  lmodel-file
  -使用因子号,LM的顺序(n-gram)和语言模型文件的路径来指示用于LM的类型(0:SRILM,1:IRSTLM)


如果还不够,在this page, see "Decoder configuration file" section上还有另一个描述


  各节
  [ttable-file][lmodel-file]包含指向短语表的指针
  文件和语言模型文件。您可以忽略
  这些行上的数字。暂时知道这一点就足够了
  语言模型规范中的最后一个数字是
  n元语法模型的顺序。
  
  配置文件还包含一些功能权重。注意
  [weight-t]部分有5个权重,每个包含的特征之一
  在词组表中。
  
  培训过程创建的moses.ini文件将无法使用
  您的解码器无需修改,因为它依赖一种语言
  未编译到我们的解码器中的模型库。为了要做
  工作正常,打开moses.ini文件并找到语言模型
  [lmodel-file]标题之后的行中的指定。
  这行的第一个数字是0,代表SRILM。
  将其更改为8,其余部分保持不变。那你的
  配置应该工作。

关于machine-learning - Moses的文档(统计机器翻译)mose.ini文件格式?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/30033707/

10-12 13:56