查看OpenCV文档cvThreshold(),在二值化函数cvThreshold(const CvArr* src, CvArr* dst, double threshold, double max_value, int threshold_type)中,参数threshold_type有5种类型:
- THRESH_BINARY
- THRESH_BINARY_INV
- THRESH_TRUNC
- THRESH_TOZERO
- THRESH_TOZERO_INV
问题来了:为什么可以在threshold_type参数中使用CV_THRESH_OTSU,在哪里可以查看这种OTSU,它用的什么方法?经多次验证,二值化的效果很好,且速度很快。
已经有一些同志在使用:
例证1:例证1
例证2:例证2
例证3:例证3
我的遭遇:为了二值化一个比较大的图像(10M,3840*2748),痛苦的看了各种论文,尝试了各种的二值化方法:一维OTSU,快速迭代的一维OTSU,二维的OTSU,快速迭代的二维OTSU。但现实的残酷的!只有二维的OTSU和快速迭代的OTSU可用,但前者处理时间让人难以接受,后者也要500多个ms。 快速迭代的二维OTSU算法是根据吴一全老师的《二维最大类间方差阈值分割的快速迭代算法》(论文下载链接,提取码:fd0b)来实现的。但是令我哭笑不得的是,无意中在网上发现了一种方法threshold_type使用参数使用CV_THRESH_OTSU时,时间却大大的缩短。程序如下(
程序下载链接提取码:fd0b),图像下载 (提取码:24f3)。
/* otsu_2d:二维最大类间方差阈值分割的快速迭代算法 吴一全 */
#include <iostream>
#include <cv.h>
#include <highgui.h> using namespace std;
double TwoDimentionOtsu(IplImage *image);
int main()
{
IplImage* srcImage = cvLoadImage( "E:/image_1/14.bmp", );
assert(NULL != srcImage); cvNamedWindow("src",);
cvShowImage("src",srcImage); clock_t start_time=clock(); //计算最佳阈值
double threshold = TwoDimentionOtsu(srcImage);//70,125 clock_t end_time=clock();
cout<< "Running time is: "<<static_cast<double>(end_time-start_time)/CLOCKS_PER_SEC*<<"ms"<<endl;//输出运行时间 cout << "threshold=" << threshold << endl; IplImage* biImage = cvCreateImage(cvGetSize(srcImage),,);
//对图像二值化
//cvThreshold(srcImage,biImage,255,255, CV_THRESH_OTSU | CV_THRESH_BINARY);
cvThreshold(srcImage,biImage,threshold,, CV_THRESH_BINARY); cvNamedWindow("binary",);
cvShowImage("binary",biImage); cvWaitKey(); cvReleaseImage(&srcImage);
cvReleaseImage(&biImage); cvDestroyAllWindows(); return ;
}
double TwoDimentionOtsu(IplImage *image)
{
double t0 = , s0 = , t = , s = ;
int width = image->width;
int height = image->height;
double dHistogram[][]={0.0}; //建立二维灰度直方图
unsigned long sum0 = ,sum1 = ; //sum0记录所有的像素值的总和,sum1记录3x3窗口的均值的总和
uchar* data = (uchar*)image->imageData;
for(int i=; i<height; i++)
{
for(int j=; j<width; j++)
{
unsigned char nData1 = data[i * image->widthStep + j];//nData1记录当前点(i,j)的像素值
sum0 += nData1;
unsigned char nData2 = ; //nData2记录以当前点(i,j)为中心三领域像素值的平均值
int nData3 = ; //nData3记录以当前点(i,j)为中心三领域像素值之和,注意9个值相加可能超过一个字节
for(int m=i-; m<=i+; m++)
{
for(int n=j-; n<=j+; n++)
{
if((m>=)&&(m<height)&&(n>=)&&(n<width))
nData3 += data[m * image->widthStep + n];
}
}
nData2 = (unsigned char)(nData3/); //对于越界的索引值进行补零,邻域均值
sum1 += nData2;
dHistogram[nData1][nData2]++;
}
} long N = height*width; //总像素数
t = sum0/N; //图像灰度级均值
s = sum1/N; //邻域平均灰度级的均值 s0 = s;
t0 = t;
for(int j=; j<; j++)
for(int i=; i<; i++)
{
dHistogram[i][j] = dHistogram[i][j]/N; //得到归一化的概率分布
} double w0 = 0.0,w1 = 0.0,u0i = 0.0,u1i = 0.0,u0j = 0.0,u1j = 0.0; do
{
t0 = t;
s0 = s;
w0 = w1 = u0i = u1i = u0j = u1j = 0.0;
for (int i = ,j; i < ; i++)
{
for (j = ; j < s0; j++)
{
w0 += dHistogram[i][j];
u0j += dHistogram[i][j] * j;
} for (; j < ; j++)
{
w1 += dHistogram[i][j];
u1j += dHistogram[i][j] * j;
} }
for (int j = ,i = ; j < ; j++)
{
for (i = ; i < t0; i++)
u0i += dHistogram[i][j] * i;
for (; i < ; i++)
u1i += dHistogram[i][j] * i;
}
u0i /= w0;
u1i /= w1 ;
u0j /= w0;
u1j /= w1; t = (u0i + u1i)/;
s = (u0j + u1j)/;
}while ( t != t0);//是否可以用这个做为判断条件,有待考究,请高手指点 return t;//只用t做为阈值,个人也感觉不妥,但没有找到更好的方法,请高手指点 }
输出结果:
cvThreshold()参数设为CV_THRESH_OTSU,输入结果: