我正在寻找参考文献,在这里我可以发现转移学习需要来自特定领域的源模型,而不是使用通用模型即imagenet

例如,使用农业机器人捕获的植物的源数据集卫星/无人机超/多光谱图像和植物的超/多光谱图像的目标数据集

相比于

使用农业机器人捕获的植物的源数据集ImageNet模型和目标数据集图像

最佳答案

如果您没有足够的数据,则转移学习对于准确性尤其有趣。例如,this paper比较了在imagenet上有和没有预训练的训练。他们声称,经过10k图像处理后,预训练不会产生更好的结果,但仍然可以加快训练速度。
然后,如果您的数据集很小,那么您的问题仍然是应该在imagenet还是另一个数据集上进行预训练。我认为下段给出了这个问题的答案(您可能会对其中的引用感兴趣):


  我们需要大数据吗?是。但是,如果我们考虑到收集和清理数据的额外工作,那么通用的大规模分类级别的预训练集就不理想了-收集ImageNet的成本在很大程度上被忽略了,但是在其中,“预训练”步骤实际上,当我们扩展此范式时,“预培训+微调”范式实际上并不是免费的。如果大规模分类级别的预训练的收益成倍减少[44,30],则在目标域中收集数据会更加有效。


因此,您还需要考虑卫星图像数据集的质量。由于它应该比Imagenet更接近您的数据,因此可能更好。

关于machine-learning - 转移学习需要来自更相关的领域吗?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/59928877/

10-12 21:53