我在Java中实现了textrank,但它似乎很慢。有人知道它的预期性能吗?

如果预计不会很慢,可能是以下任何一个问题:

1)似乎没有一种方法可以在JGraphT时间中同时创建边缘并为其添加权重,因此我计算权重,如果它大于0,则添加一条边缘。稍后我重新计算权重,以在遍历边缘时将其添加。那是一个可怕的主意吗?

2)我正在使用JGraphT。那是一个慢图书馆吗?

3)我还能做些什么来使其更快?

最佳答案

这取决于您所说的“相当慢”。谷歌搜索发现本段:


“从文件中读取摘要并加载到内存后,我们计算了RAKE和TextRank从500个Inspec测试集中提取关键词的总时间(从文件中提取摘要并加载到内存中。RAKE从500个摘要中提取关键词)。 160毫秒。TextRank在1002毫秒内提取了关键字,是RAKE时间的6倍。”


(有关上下文,请参见http://www.scribd.com/doc/51398390/11/Evaluating-ef%EF%AC%81ciency。)

因此,据此推断,一个不错的TextRank实现应该能够在大约1秒钟内从大约500个摘要中提取关键字。

关于java - TextRank运行时间,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/8765710/

10-12 02:17