当我运行命令时
bin \ mallet train-topics --input input.tutorial.mallet --num-topics 40 --num-iterations 100 --optimize-interval 50 --optimize-burn-in 200 --output-state input.gz- output-topic-keys inputkeys.txt --output-doc-topics input-proportion.txt

在运行命令的每个实例中,我都会得到不同的结果。

输出:

0 AJAY_DASARI 19 0.062051649928263994 39 0.03263988522238164 35 0.03263988522238164 33 0.03263988522238164 32 0.03263988522238164 23 0.03263988522238164 ...............
1 BALVINDERSINGH 21 0.06297779395704405 36 0.04805242082271569 22 0.04805242082271569 35 0.03312704768838733 32 0.03312704768838733 31 0.03312704768838733 30 0.03312704768838733 26 0.03312704768838733 24 0.03312704768838733 15 0.03312704768838733 13 ................

每次使用命令时如何获得相同的结果

最佳答案

训练模型时,请使用选项--random-seed INTEGER(不同于0,否则使用时钟)来修复随机种子。它应该在多次运行中为您提供一致的结果。

此功能有一个错误,在开发版本中为now fixed
请参见MALLET's download page以构建最新版本。

关于machine-learning - bin/mallet训练主题在每个实例中得到不同的结果,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/18050891/

10-12 20:01