周五实验室有同学报告了ICCV2013的一篇论文group sparsity and geometry constrained dictionary learning for action recognition from depth maps。这篇文章是关于Sparsing Coding的。Sparse coding并不是我的研究方向。在此仅仅是做个文献阅读后的笔记,权当开拓下我的视野。

从标题就能够看出,这篇论文试图通过学习到group sparsity和geometry constrained的词典用于深度图的行为识别。像曾经看到的Sparse Coding 论文一样,本文也用一张美丽的示意图给出了本文算法和Kmeans 、一般的Sparse Coding等算法的不同。例如以下

文献阅读笔记——group sparsity and geometry constrained dictionary-LMLPHP

图中的(a)和(b)两个子图比較常见。子图(c)为Sparse Coding+group sparsity ,由图不难看出group sparsity是指将各类样本仅用各类相应的子字典表示。子图(d)是作者提出的算法,相比(c)增加了几何限制,即原特征空间上近的样本经稀疏表示后距离也要近,即尽量保持样本在原空间的几何远近关系。

理解了作者的意图后,我们不难理解本文建立的模型。相对于以往研究者的工作,本文的模型添加了最后一项。由于添加的项为凸,所以加上一项依旧保持了函数的凸性,因此模型的优化方法和一般的Sparse Coding算法是一样的。

文献阅读笔记——group sparsity and geometry constrained dictionary-LMLPHP

04-25 13:48