图像切割之(一)概述
所谓图像切割指的是依据灰度、颜色、纹理和形状等特征把图像划分成若干互不交迭的区域,并使这些特征在同一区域内呈现出相似性,而在不同区域间呈现出明显的差异性。我们先对眼下基本的图像切割方法做个概述,后面再对个别方法做具体的了解和学习。
1、基于阈值的切割方法
阈值法的基本思想是基于图像的灰度特征来计算一个或多个灰度阈值,并将图像中每一个像素的灰度值与阈值相比較,最后将像素依据比較结果分到合适的类别中。因此,该类方法最为关键的一步就是依照某个准则函数来求解最佳灰度阈值。
2、基于边缘的切割方法
所谓边缘是指图像中两个不同区域的边界线上连续的像素点的集合,是图像局部特征不连续性的反映,体现了灰度、颜色、纹理等图像特性的突变。通常情况下,基于边缘的切割方法指的是基于灰度值的边缘检測,它是建立在边缘灰度值会呈现出阶跃型或屋顶型变化这一观測基础上的方法。
阶跃型边缘两边像素点的灰度值存在着明显的差异,而屋顶型边缘则位于灰度值上升或下降的转折处。正是基于这一特性,能够使用微分算子进行边缘检測,即使用一阶导数的极值与二阶导数的过零点来确定边缘,详细实现时能够使用图像与模板进行卷积来完毕。
3、基于区域的切割方法
此类方法是将图像依照相似性准则分成不同的区域,主要包含种子区域生长法、区域分裂合并法和分水岭法等几种类型。
种子区域生长法是从一组代表不同生长区域的种子像素開始,接下来将种子像素邻域里符合条件的像素合并到种子像素所代表的生长区域中,并将新加入的像素作为新的种子像素继续合并过程,直到找不到符合条件的新像素为止。该方法的关键是选择合适的初始种子像素以及合理的生长准则。
区域分裂合并法(Gonzalez,2002)的基本思想是首先将图像随意分成若干互不相交的区域,然后再依照相关准则对这些区域进行分裂或者合并从而完毕切割任务,该方法既适用于灰度图像切割也适用于纹理图像切割。
分水岭法(Meyer,1990)是一种基于拓扑理论的数学形态学的切割方法,其基本思想是把图像看作是測地学上的拓扑地貌,图像中每一点像素的灰度值表示该点的海拔高度,每个局部极小值及其影响区域称为集水盆,而集水盆的边界则形成分水岭。该算法的实现能够模拟成洪水淹没的过程,图像的最低点首先被淹没,然后水逐渐淹没整个山谷。当水位到达一定高度的时候将会溢出,这时在水溢出的地方修建堤坝,反复这个过程直到整个图像上的点所有被淹没,这时所建立的一系列堤坝就成为分开各个盆地的分水岭。分水岭算法对微弱的边缘有着良好的响应,但图像中的噪声会使分水岭算法产生过切割的现象。
4、基于图论的切割方法
此类方法把图像切割问题与图的最小割(min cut)问题相关联。首先将图像映射为带权无向图G=<V,E>,图中每一个节点N∈V相应于图像中的每一个像素,每条边∈E连接着一对相邻的像素,边的权值表示了相邻像素之间在灰度、颜色或纹理方面的非负相似度。而对图像的一个切割s就是对图的一个剪切,被切割的每一个区域C∈S相应着图中的一个子图。而切割的最优原则就是使划分后的子图在内部保持相似度最大,而子图之间的相似度保持最小。基于图论的切割方法的本质就是移除特定的边,将图划分为若干子图从而实现切割。眼下所了解到的基于图论的方法有GraphCut,GrabCut和Random Walk等。
5、基于能量泛函的切割方法
该类方法主要指的是活动轮廓模型(active contour model)以及在其基础上发展出来的算法,其基本思想是使用连续曲线来表达目标边缘,并定义一个能量泛函使得其自变量包含边缘曲线,因此切割过程就转变为求解能量泛函的最小值的过程,一般可通过求解函数相应的欧拉(Euler.Lagrange)方程来实现,能量达到最小时的曲线位置就是目标的轮廓所在。依照模型中曲线表达形式的不同,活动轮廓模型能够分为两大类:參数活动轮廓模型(parametric active contour model)和几何活动轮廓模型(geometric active contour model)。
參数活动轮廓模型是基于Lagrange框架,直接以曲线的參数化形式来表达曲线,最具代表性的是由Kasset a1(1987)所提出的Snake模型。该类模型在早期的生物图像切割领域得到了成功的应用,但其存在着切割结果受初始轮廓的设置影响较大以及难以处理曲线拓扑结构变化等缺点,此外其能量泛函仅仅依赖于曲线參数的选择,与物体的几何形状无关,这也限制了其进一步的应用。
几何活动轮廓模型的曲线运动过程是基于曲线的几何度量參数而非曲线的表达參数,因此能够较好地处理拓扑结构的变化,并能够解决參数活动轮廓模型难以解决的问题。而水平集(Level Set)方法(Osher,1988)的引入,则极大地推动了几何活动轮廓模型的发展,因此几何活动轮廓模型一般也可被称为水平集方法。