词袋模型是一种文本表征方法,它应用到计算机视觉领域就称之为BoF(bag of features),通过BoF可以把一张图片表示成一个向量。DBoW2是一个视觉词袋库,它提供了生成和使用词典的接口,但它并不等同于slam中的回环检测。
回环检测属于slam前端,也是vslam三大模块(视觉里程计,回环,优化)之一。回环检测的主要目的是确认当前位置是否曾经到达过。它接收一段图片序列,然后绘制拓扑地图,故又称之为拓扑制图。基于BoF的回环检测是目前比较流行的回环解决方案,诸如IAB-MAP,FAB-MAP,RTAB-MAP等都使用这种解决方案。一个典型的基于BoF的回环方案主要由3个部分组成:BoF模块+回环检测算法模块+验证模块。从方案处理的数据的不同上又可以分为基于关键帧的和基于连续序列的。例如DLoopDetector就是基于连续序列的BoF回环方案,而RTAB-MAP是基于关键帧的BoF回环方案。
DLoopDetector基于DBoW2构建和使用视觉词典,并且添加了回环检测算法模块和验证模块,所以它是一个完整的回环检测/拓扑制图系统。本篇关注其LC算法部分,LC算法主要有bayes方法和相似性方法两种,DLoopDetector采用的就是相似性方法。除了采用DBoW2库中的基本的向量相似度度量,DLoopDetector作者针对连续序列回环检测问题设计了两种相似性度量:
(1) 帧与帧之间的回环相似性度量
(2) 帧与一段帧序列之间的回环相似性度量
算法会通过找寻最优匹配帧序列的方式找到最优匹配帧。由于闭环往往存在时间上的连续性,所以如果当前闭环成立,还会用同样的方法处理邻近k帧。
参考文献:
1, Galvez-López, D, Tardos, J.D. Bags of Binary Words for Fast Place Recognition in Image Sequences[J]. Robotics IEEE Transactions on, 2012, 28(5):1188-1197.
2, Gálvez-López D, Tardós J D. Real-time loop detection with bags of binary words[C]// IEEE/RSJ International Conference on Intelligent Robots & Systems. 2011:51-58.
3, 中译文:董海霞, 曾连荪. 视觉SLAM中闭环检测算法的研究[J]. 微型机与应用, 2016, 35(5):1-3.