我正在尝试根据线条/笔触的粗细比较文本和非文本区域。使用距离变换及其后的一些修饰,设法获得了包含图片中特征的每个笔划的厚度(实际上是厚度的一半)。

这是程序运行的典型结果:

1.文字区域


  • 非文本



  • 那么,有没有一种统计方法比标准偏差更复杂,可以表明两个数据集之间的差异:一个逐渐变化而第二个数据变化很大?
    (包括可怕的数字来说明我正在尝试量化的数字!)

    还请注意,数据点的数量将不一样,因为我将比较具有实验确定的SD阈值(或其他度量)的不同区域,而不是它们之间的区域。

    最佳答案

    我想到的是,您可以对块进行小波变换,然后查看与高频小波相关的平均能量。

    如果您对小波不熟悉,最简单的描述就是Haar wavelet。假设您采样的点数为2n,则可以如下计算:

  • 将数据划分为成对的点。
  • 取差额的1/2。那就是细节小波的系数。
  • 取每对的平均值。这给你2n-1分。递归地对它们进行小波变换。

  • 对于Haar小波的每个级别,取系数平方的平均值。如果您的数据确实看起来像您所描述的那样,那么前几个级别的统计信息将大不相同。做实验,确定您的阈值在哪里,然后您可能会进行一个相当可靠的测试。 (我建议您从测试中获得3个可能的答案:“文本”,“非文本”,“不清楚”。查看“不清楚”的示例,然后改进您的测试。)

    10-01 00:55
    查看更多