早上好,

我在我的应用程序中使用了斯坦福大学的部分语言,而且我需要解析许多文本文件(最多可以解析20个文件)。但是我注意到斯坦福大学要花费很多时间(有时需要30分钟或更长时间),问题是斯坦福大学会自动构建语法树,即使我不需要它也是如此。
有人遇到过这个问题吗?如何减少斯坦福大学的解析时间?

欢迎任何帮助,
问候。

最佳答案

如果您只想要语音的一部分,而不是解析树,则应运行语音标记器的(序列模型)部分,例如Stanford POS Tagger,这要快几个数量级。请参见Stanford Parser FAQ。 (如果要快速标记,请使用Stanford POS Tagger的left3words-wsj-0-18.tagger模型。)

关于java - 如何减少斯坦福解析器的执行时间?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/6122777/

10-09 15:56