machine-learning - 跌落时识别物体-视点变化

我有一个问题陈述，要考虑到相机看到物体的不同视点，同时识别同一对象（瓶盖）的10种不同变化（颜色和大小的变化）。我已将其分为子任务

1）训练了深度学习模型，仅对对象的平面分类，并成功进行了此尝试。

样品2类的平面



2）而不是考虑进去，而是针对可能的视角变化训练了模型-不成功。

样本2类的感知变化



有什么方法可以识别物体，甚至进行透视图更改。我不受单一相机解决方案的约束。在解决这个可变的观念问题时，对思想持开放态度。

任何帮助，我们将不胜感激，在此先感谢！

最佳答案

我想给你的答案是：CapsNets

您应该一定要检查本文，向您介绍CNN的一些不足之处以及它们如何解决这些问题。

就是说，我很难相信当视角改变时，您的架构无法成功解决问题。您的数据集是否极小？我希望神经网络能够学习针对riff纹边缘的过滤器，这可以从所有角度看到。

如果您不仅限于一台相机，则可以尝试训练“正常”分类器，在生产中输入多张图像并平均预测值。或者，您可以构建一次包含多个视角的体系结构。您必须自己尝试，什么才是最好的。

另外，永远不要低估老式图像预处理的功能。如果您有3个不同的视角，则可以采用最接近“扁平”视角的视角。这可能和使用彩色区域最大的图像一样容易，其中img.sum()最高。

另一个想法是通过显式编程找出颜色，这应该相当容易，然后为网络提供灰度图像。也许您的网络被颜色的强相关性所迷惑，而完全忽略了形状。

关于machine-learning - 跌落时识别物体-视点变化，我们在Stack Overflow上找到一个类似的问题：https://stackoverflow.com/questions/48190418/