我正在为最后一个项目进行研究,我想像Amazon Go一样进行对象检测和运动分类,我已经阅读了很多研究,例如使用SSD或YOLO进行对象检测以及使用CNN + LSTM进行视频分类,我想提出训练算法像这样:
使用SSD / YOLO实时检测多个物体(在我的情况下为人)
获取边界对象并裁剪框架
将裁剪的帧信息输入到CNN + LSTM算法中以进行运动预测(如果此人正在行走/携带物品)
是否可以在实时环境中实现?
还是有更好的实时检测和运动分类方法
最佳答案
如果要在实时应用程序中使用它,则必须考虑其他一些事情,这些事情在实际环境中实现算法之前不会出现。
关于您建议的三步方法,可能已经是一种好的方法,但是第一步将非常准确。我认为最好将三个步骤合为一个步骤。因为人的运动类型是人的一个好特征。因此,我认为所有步骤都可以集中在一个步骤中。
我的想法如下:
1.视频分类数据集,仅标记人物或物体的运动
2.基于cnn-lstm的视频分类方法
这样可以正确解决您的项目。
该答案需要更多详细信息,如果您有兴趣,我可以提供更多详细信息。
关于machine-learning - 需要有关实时视频的目标检测和运动分类的建议,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/58361711/