语义分割只是一个Pleonasm还是“语义分割”和“分割”之间有区别? “场景标注”或“场景解析”有区别吗?

像素级分割和像素级分割有什么区别?

(附带问题:当您有这种像素级注释时,您是免费获得对象检测还是还有其他事情要做?)

请给出你的定义的来源。

使用“语义分割”的来源

  • Jo​​nathan Long、Evan Shelhamer、Trevor Darrell:Fully Convolutional Networks for Semantic Segmentation。 CVPR, 2015 和 PAMI, 2016
  • Hong、Seunghoon、Hyeonwoo Noh 和 Bohyung Han:“用于半监督语义分割的解耦深度神经网络。” arXiv preprint arXiv:1506.04924 , 2015.
  • V. Lempitsky、A. Vedaldi 和 A. Zisserman:语义分割的 pylon 模型。神经信息处理系统进展,2011.

  • 使用“场景标签”的来源
  • Clement Farabet、Camille Couprie、Laurent Najman、Yann LeCun:Learning Hierarchical Featuresfor Scene Labeling。在模式分析和机器智能中,2013 年。

  • 使用“像素级”的源
  • Pinheiro、Pedro O. 和 Ronan Collobert:“使用卷积网络从图像级到像素级标记。” IEEE 计算机视觉和模式识别 session 论文集,2015 年。(见 http://arxiv.org/abs/1411.6228)

  • 使用“逐像素”的源
  • Li、Hongsheng、Rui Zhao 和 Xiaogang Wang:“用于像素分类的卷积神经网络的高效前向和后向传播。” arXiv preprint arXiv:1412.4526 , 2014.

  • 谷歌 Ngrams

    “语义分割”最近似乎比“场景标记”用得更多

    image-processing -  "semantic segmentation"与  "segmentation"和  "scene labeling"相比是什么?-LMLPHP

    最佳答案

    "segmentation" 是将图像分割成几个“连贯的”部分,但没有尝试理解这些部分代表什么。最著名的作品之一(但绝对不是第一个)是 Shi and Malik "Normalized Cuts and Image Segmentation" PAMI 2000 。这些作品试图根据颜色、纹理和边界平滑度等低级线索来定义“连贯性”。您可以将这些作品追溯到 Gestalt theory

    另一方面 “语义分割” 尝试将图像划分为语义上有意义的部分,并将每个部分分类为一个预先确定的类。您还可以通过对每个像素(而不是整个图像/片段)进行分类来实现相同的目标。在这种情况下,您正在进行逐像素分类,这会导致相同的最终结果,但路径略有不同......

    所以,我想你可以说“语义分割”、“场景标记”和“逐像素分类”基本上都在努力实现相同的目标:从语义上理解图像中每个像素的作用。您可以采取多种途径来实现该目标,而这些途径会导致术语上的细微差别。

    关于image-processing - "semantic segmentation"与 "segmentation"和 "scene labeling"相比是什么?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/33947823/

    10-15 02:34