###### 在Linux系统下运行 #######
实验步骤:
Step 1:
从github上下载工具包
wget https://github.com/clab/fast_align/archive/master.zip
Step 2:
将语料处理成 “ 源语言 ||| 目标语言 ” 的形式。
Step 3:
安装必要的工具包:
sudo apt-get install libgoogle-perftools-dev libsparsehash-dev
Step 4:
分步执行:
mkdir build
cd build
cmake ..
make
Step 5:
运行代码如下:
##### 生成 源==>目标 的对其方式:
./fast_align -i text.fr-en -d -o -v > forward.align
##### 生成 目标==>源 的对其方式:./fast_align -i text.fr-en -d -o -v -r > reverse.align
##### 可以atools
使用各种标准对称启发法,使用包含的命令来对称化这些参数,例如:
./atools -i forward.align -j reverse.align -c grow-diag-final-and
Step 6:
输出结果为:
####其中一对i-j
表示左语言(按照惯例,源语言)的第i个单词(零索引)与右句的第j个单词(按照约定,目标语言)
0-0 1-1 2-4 3-2 4-3 5-5 6-6
0-0 1-1 2-2 2-3 3-4 4-5
0-0 1-2 2-1 3-3 4-4 5-5