关于大型数据库中相似图像或文本的快速查询,我正在阅读有关词汇树的很多内容。但是我找不到关于这种词汇树是什么以及如何构建功能之一的任何好的(易于理解的)描述。

最佳答案

词汇树是一种进行图像检索的紧凑方法。基本上有3个步骤来实现此算法,并且它高度依赖于其他计算机视觉技术,例如SIFT功能。

第一步是使用筛选描述符构建kmeans树。该树的叶节点包含一个“袋子”的筛选描述符。第二步是使用第一步中构建的词汇树来构建图像数据库。您可以将此过程视为将图像量化到向量空间中。然后,第三步是针对图像数据库查询图像。当然,有一些详细的技术,例如倒排列表等。

这是词汇树libvot的良好实现。它基本上遵循我上面描述的三个步骤。它使用C++ 11标准多线程库来加速构建过程,因此运行速度非常快。

这是关于它的原始研究paper。这些年来,它对计算机视觉社区产生了巨大影响。

关于data-structures - 什么是词汇树,以及如何建立词汇树?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/2169909/

10-10 23:02