这个问题首先要明白二维otsu得到的(s,t)的含义。
二维otsu分割得到的数值(s,t)定义在图像二维直方图上,也就是一个LxL大小的正方形区域,L表示图像的灰度级(比如256),正方形区域的横坐标表示图像像元的灰度值,纵坐标表示像元的邻域的平均灰度值,该正方形区域中的任一点(i,j)的值pij表示(i,j)发生的频率。
因此,求出的二维otsu分割数值(s,t)是上述LxL大小的正方形区域中的一点,可以将此二维直方图划分为4块,对图像的分割也可以划分为如下四种,对于任意的(i,j)有:
(1) 0<i <s,且0< j<t, 的区域表示背景;
(2)s< i <L-1,且t<j<L-1, 的区域表示目标;
(3) 0<i <s,且t<j<L-1, 的区域表示噪声;
(4) s< i <L-1,且0< j<t, 的区域表示边缘;
因此,二维otsu分割时,既要考虑像素的灰度值(与s比较),还要考虑该像素灰度值邻域内灰度值的均值(与t比较),将图像按照上述的四个区域进行分割。
当然,如果简单的话,直接取阈值为s,将背景和噪声置零,将边缘和目标置为1.
cvThreshold
cvThreshold是opencv库中的一个函数 作用:函数 cvThreshold 对单通道数组应用固定阈值操作。该函数的典型应用是对灰度图像进行阈值操作得到二值图像。(cvCmpS 也可以达到此目的) 或者是去掉噪声,例如过滤很小或很大象素值的图像点。本函数支持的对图像取阈值的方法由 threshold_type 确定。 形式:void cvThreshold( const CvArr* src, CvArr* dst, double threshold, double max_value, int threshold_type ); src:原始数组 (单通道 , 8-bit of 32-bit 浮点数)。dst:输出数组,必须与 src 的类型一致,或者为 8-bit。
threshold:阈值
max_value:使用 CV_THRESH_BINARY 和 CV_THRESH_BINARY_INV 的最大值。
threshold_type:阈值类型 threshold_type=CV_THRESH_BINARY:
如果 src(x,y)>threshold ,dst(x,y) = max_value; 否则,des(x,y)=0;
threshold_type=CV_THRESH_BINARY_INV:
如果 src(x,y)>threshold,dst(x,y) = 0; 否则,dst(x,y) = max_value.
threshold_typ
=============================================================================================================
最大类间方差法(otsu)的原理:
阈值将原图象分成前景,背景两个图象。
前景:用n1, csum, m1来表示在当前阈值下的前景的点数,质量矩,平均灰度
后景:用n2, sum-csum, m2来表示在当前阈值下的背景的点数,质量矩,平均灰度
当取最佳阈值时,背景应该与前景差别最大,关键在于如何选择衡量差别的标准
而在otsu算法中这个衡量差别的标准就是最大类间方差(英文简称otsu,这也就是这个算法名字的来源)
在本程序中类间方差用sb表示,最大类间方差用fmax
关于最大类间方差法(otsu)的性能:
类间方差法对噪音和目标大小十分敏感,它仅对类间方差为单峰的图像产生较好的分割效果。
当目标与背景的大小比例悬殊时,类间方差准则函数可能呈现双峰或多峰,此时效果不好,但是类间方差法是用时最少的。
最大最大类间方差法(otsu)的公式推导:
记t为前景与背景的分割阈值,前景点数占图像比例为w0, 平均灰度为u0;背景点数占图像比例为w1,平均灰度为u1。
则图像的总平均灰度为:u=w0*u0+w1*u1。
前景和背景图象的方差:g=w0*(u0-u)*(u0-u)+w1*(u1-u)*(u1-u)=w0*w1*(u0-u1)*(u0-u1),此公式为方差公式,可参照概率论课本
上面的g的公式也就是下面程序中的sb的表达式
当方差g最大时,可以认为此时前景和背景差异最大,也就是此时的灰度是最佳阈值
unsafe public int GetThreshValue(Bitmap image)
{
BitmapData bd = image.LockBits(new Rectangle(0, 0, image.Width, image.Height), ImageLockMode.WriteOnly, image.PixelFormat);
byte* pt = (byte*)bd.Scan0;
int[] pixelNum = new int[256]; //图象直方图,共256个点
byte color;
byte* pline;
int n, n1, n2;
int total; //total为总和,累计值
double m1, m2, sum, csum, fmax, sb; //sb为类间方差,fmax存储最大方差值
int k, t, q;
int threshValue = 1; // 阈值
int step = 1;
switch (image.PixelFormat)
{
case PixelFormat.Format24bppRgb:
step = 3;
break;