我有一个问题陈述,要考虑到相机看到物体的不同视点,同时识别同一对象(瓶盖)的10种不同变化(颜色和大小的变化)。我已将其分为子任务

1)训练了深度学习模型,仅对对象的平面分类,并成功进行了此尝试。

样品2类的平面

machine-learning - 跌落时识别物体-视点变化-LMLPHP machine-learning - 跌落时识别物体-视点变化-LMLPHP

2)而不是考虑进去,而是针对可能的视角变化训练了模型-不成功。

样本2类的感知变化

machine-learning - 跌落时识别物体-视点变化-LMLPHP machine-learning - 跌落时识别物体-视点变化-LMLPHP

有什么方法可以识别物体,甚至进行透视图更改。我不受单一相机解决方案的约束。在解决这个可变的观念问题时,对思想持开放态度。

任何帮助,我们将不胜感激,在此先感谢!

最佳答案

我想给你的答案是:CapsNets

您应该一定要检查本文,向您介绍CNN的一些不足之处以及它们如何解决这些问题。

就是说,我很难相信当视角改变时,您的架构无法成功解决问题。您的数据集是否极小?我希望神经网络能够学习针对riff纹边缘的过滤器,这可以从所有角度看到。

如果您不仅限于一台相机,则可以尝试训练“正常”分类器,在生产中输入多张图像并平均预测值。或者,您可以构建一次包含多个视角的体系结构。您必须自己尝试,什么才是最好的。

另外,永远不要低估老式图像预处理的功能。如果您有3个不同的视角,则可以采用最接近“扁平”视角的视角。这可能和使用彩色区域最大的图像一样容易,其中img.sum()最高。

另一个想法是通过显式编程找出颜色,这应该相当容易,然后为网络提供灰度图像。也许您的网络被颜色的强相关性所迷惑,而完全忽略了形状。

关于machine-learning - 跌落时识别物体-视点变化,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/48190418/

10-12 23:45