楊勇(1963-)
男,湖北淞滋人,大學(xué)本科,自動(dòng)化控制專(zhuān)業(yè)。
摘 要:為了能夠更好的去除圖像的噪聲和很好的保留圖像的邊緣信息,提出了基于HSV空間的均值移動(dòng)平滑算法。首先將圖像轉化到HSV空間,由于HSV空間三個(gè)分量的相關(guān)性弱,根據HSV三個(gè)分量不同的特性采取不同的步長(cháng)進(jìn)行圖像平滑處理,這樣很好的克服了由于RGB三分量相關(guān)性太強不便于分別平滑處理的缺點(diǎn)。試驗表明該方法比基于RGB空間的均值移動(dòng)算法能更好的滿(mǎn)足對平滑結果的要求。
關(guān)鍵詞:均值移動(dòng);圖像平滑;HSV空間
Abstract: For reducing noise and preferably keeping the edge information, the mean-shift algorithm based on the HSV space was proposed. Firstly the image was transferred from RGB space to HSV space. Because the correlation of HSV was very little, H,S and V separately were smoothed based on the different step sizes. This can overcome the drawback that R,G, and B could not be separately smoothed due to their strong correlation. The experiments prove that this algorithm could get better result than the mean-shift based on RGB space.
Key words: mean-shift; image smoothing; HSV space
1 引言
數字圖像的平滑濾波一直是圖像處理和圖像分析領(lǐng)域的一項重要技術(shù)。這方面的研究成果很多,歸納起來(lái)主要有以下幾類(lèi)方法[1]:鄰域平均法、多圖平均法、中值濾波法和頻域低通濾波法等。而本文所用的均值移動(dòng)法是一種非參數密度估計梯度法,通過(guò)有效的統計迭代算法,使每一個(gè)點(diǎn)“漂移”到密度函數的局部極大值點(diǎn)。均值移動(dòng)算法的原型“valley-seeking procedure[2]”由Fukunaga和Hostetler在1975年提出,但是并沒(méi)有得到學(xué)術(shù)界的重視。直到1995年Y.Cheng成功將此算法擴展至計算機視覺(jué)領(lǐng)域[3-9],才引起了廣泛的關(guān)注。目前它已經(jīng)在圖像分割,圖像平滑和目標跟蹤中得到了廣泛的應用。
傳統的均值移動(dòng)算法主要集中在RGB空間進(jìn)行圖像處理。但RGB空間中三個(gè)分量的相關(guān)性強不利于分別處理。所以本文提出了一種基于HSV顏色空間的圖像平滑算法,即根據HSV三個(gè)分量的不同特性選擇不同的步長(cháng)進(jìn)行平滑,然后將平滑結果進(jìn)行融合得到最后的平滑結果。
2 均值移動(dòng)算法
均值遷移方法利用核函數的性質(zhì),無(wú)需對整個(gè)區域的概率密度進(jìn)行估計,就能利用核對點(diǎn)的梯度進(jìn)行估計,并進(jìn)一步導出均值遷移步長(cháng)。于是在介紹均值移動(dòng)算法之前首先介紹一下核密度估計。
2.1 核密度估計
目前幾種常用的核函數分別為均布核、Epanechnikov核、高斯核和裁剪過(guò)的高斯核、光滑多項式核。本文用高斯核進(jìn)行圖像平滑處理。
設d維空間Rd中有n個(gè)數據點(diǎn)xi,i=1…n,點(diǎn)x關(guān)于核函數K(x)和d×d的對稱(chēng)正定帶寬矩陣H的多元核函數密度估計為:
(1)
其中: (2)
d元核函數K(x)為具有緊支集的有界函數,滿(mǎn)足
(3)
(4)
(5)
(6)
式中為常數,
是核
的協(xié)方差矩陣。多元核函數
可以由徑向基函數
合成。合成方法主要分為兩種,一種通過(guò)徑向基的乘積得到,即
(7)
另一種方法是在Rd空間中旋轉來(lái)合成,即
(8)
(9)
式中,是徑向對稱(chēng)的,系數
保證
的積分為1。
為簡(jiǎn)化處理,通常采用一類(lèi)特殊的徑向對稱(chēng)核函數滿(mǎn)足。
(10)
(11)
式中,系數選取的原則是保證
的積分為1,
為非負,遞減、分段連續的函數。令帶寬矩陣
,可以進(jìn)一步簡(jiǎn)化密度估計的復雜度,這樣只需確定一個(gè)帶寬參數h>0即可。值得注意的是,首先需要保證特征空間具有效的歐幾里得尺度。這樣核密度估計函數就可以寫(xiě)成如下形式:
(12)
由式(10)(12)得到
(13)
在本文中k(x) =。
2.2 均值移動(dòng)算法
Mean-shift算法是一種基于核密度估計的無(wú)參快速模式匹配算法[3]。設A是嵌入在n維歐式空間X中的有限集合.K(x)中心對稱(chēng)且滿(mǎn)足,k(x)定義在x≥0區間上。k(x)稱(chēng)為K(x)的輪廓(profile)函數。于是核密度估計可以寫(xiě)成:
(14)
使用核K(x)的密度估計梯度為
(15)
設,于是g對應一新核
。
新核的概率密度為: (16)
將g(x)代入式(15)得:
(17)
式(17)為均值移動(dòng)得移動(dòng)矢量。結合式(16)得
(18)
于是 (19)
從式(19)可以看出的運動(dòng)方向與梯度的變化方向相同,大小與梯度的歸一化值成正比。下面證明均值移動(dòng)的收斂性。
設如果核k(x)的原型k(x),是單調遞減的凸函數,則數列
和函數
密度收斂,且
單調遞增。
證明:由于核k(x)為單調遞減的凸函數。所以。(在證明過(guò)程中用
代替
)。
因為n有界,所以為有界函數,根據上面推導,可知
為單調遞增函數,所以
收斂。
3 圖像平滑
3.1 顏色空間轉換
顏色空間指的是某個(gè)三維顏色空間中的一個(gè)可見(jiàn)光子集。它包含某個(gè)顏色域的所有顏色。顏色空間的用途是在某個(gè)顏色域內方便地指定顏色。一般圖像常采用RGB三元色彩色空間表示,但RGB三色空間中兩點(diǎn)間的歐氏距離與顏色距離不成線(xiàn)性比例,顏色受亮度的影響很大,各分量之間相關(guān)性強。本文采取了相關(guān)性弱,便于各分量分別處理的HSV空間進(jìn)行圖像平滑處理。
3.2 均值平滑
Mean-Shift的特征空間分析技術(shù)是獨立于具體應用的,所以可以用來(lái)開(kāi)發(fā)用途廣泛的算法,其中之一就是圖像平滑。
一幅圖像可以表示為一個(gè)具有r維矢量(像素)的2維網(wǎng)格,這里當r為1的時(shí)候表示灰度圖像,為3表示彩色圖像,若r>3則表示多光譜圖像。網(wǎng)格所在的空間稱(chēng)為空域,而灰度、色彩、光譜信息所在的空間稱(chēng)為色度域。在兩個(gè)域中都采用歐氏度量。當位置和色度矢量在一個(gè)維數為d=r+2的聯(lián)合域中時(shí),由于這兩者完全小同,必須通過(guò)適當的歸一化處理進(jìn)行補償。雖然是把這兩種信息(空間和色度)聯(lián)合處理,但在處理時(shí),仍然要有所區別。而在各自的域內,就可以小加區別地處理。于是,多元核定義為兩個(gè)中心對稱(chēng)的核的乘積,對每個(gè)域,歐氏度量使用一個(gè)單一的帶寬參數。公式如下:
(27)
其中是特征矢量的空間部分,
是強度部分,k(x)是用在兩個(gè)域的公共函數式,在本文使用高斯函數,
和
是所用核的帶寬,C是相應的歸一化常數。用戶(hù)只需要設置帶寬參數(
,
),這個(gè)參數通過(guò)控制核的大小,決定模式檢測,h也就是濾波時(shí)的分辨率。
算法如下:
令分別表示d維聯(lián)合域中的原始和濾波后像素點(diǎn)。
表示分割后圖像中的第i個(gè)像素的標號。
(1)對圖像進(jìn)行Mean Shift濾彼并把所有關(guān)于d維收斂點(diǎn)的信息都保存在中;
(2)在聯(lián)合域中生成聚類(lèi),把所有在空域距離小于
、并且在色度域距離小于
的點(diǎn)組合在一起,也就是把相似的收斂點(diǎn)的區域聯(lián)結起來(lái);
(3)將屬于一類(lèi)的象素進(jìn)行標號,(p為類(lèi)的類(lèi)別號);
(4)將面積小于一定閾值且色差小于一定閾值相臨區域合并。
4 實(shí)驗分析
本文通過(guò)平滑受噪聲污染的狒狒圖像來(lái)驗證本算法的有效性。圖1(a)為受噪聲干擾的圖像,圖1(b)為平滑前H分量立體圖,圖1(c)為平滑前S分量立體圖,圖1(d)為V平滑前立體圖。
圖1 原始圖像及其分量圖
圖2為本文算法得到的結果。圖2(a)為平滑后圖像,圖2(b)為H平滑后立體圖,圖2(c)為S平滑后立體圖,圖2(d)為V平滑后立體圖,H分量的步長(cháng)取0.1,S分量的步長(cháng)取0.05,V分量的步長(cháng)取0.1,空間步長(cháng)取7。
圖2 HSV空間平滑結果
圖3為基于RGB空間得到的平滑結果。圖3(a)為平滑后圖像,圖3(b)為R平滑后立體圖,圖3(c)為G平滑后立體圖,圖3(d)為B平滑后立體圖。顏色空間步長(cháng)取15,空間步長(cháng)取7。
圖3 RGB空間平滑結果
根據平滑的結果可以看到,本文所提算法不僅可以將一些不需要的紋理(如胡須和鼻子兩側)和噪聲平滑掉而且保持了邊界清晰(如鼻子和臉的交界處)。RGB分量平滑的結果,由于噪聲太大并沒(méi)用很好的去除圖像中的一些噪聲。
由于RGB空間中RGB三分量的相關(guān)性太強,在噪聲圖像中三分量會(huì )受不同程度噪聲的影響。在平滑過(guò)程中很難選取對RGB三分量都適應的空間和顏色步長(cháng),當噪聲和紋理較大時(shí)平滑結果可能保留部分噪聲和邊界不清晰,當噪聲或紋理較小時(shí)可以較好的去除噪聲,但可能使相同顏色特征區域產(chǎn)生塊效應。
本文所提平滑算法,主要考慮了HSV三分量相關(guān)性弱,可根據每個(gè)分量不同的特點(diǎn)選取不同的空間和顏色步長(cháng)進(jìn)行平滑處理??梢宰畲笙薅鹊膶⒃肼暤挠绊懭コ?。
5 結論
本文提出了一種基于HSV顏色空間分變量平滑的方法。此方法很好的克服了RGB空間各分量相關(guān)性強,不便于分別平滑處理的缺點(diǎn)。但本算法仍然存在需要改進(jìn)的地方,如平滑速度不快,HSV各分量的步長(cháng)非自適應選取,平滑后圖像中有的地方邊界不是很清晰等,這些將在以后的工作中解決。
參考文獻:
[1] 朱秀昌,劉峰,胡棟. 數字圖像處理與圖像通信[M]. 北京: 北京郵電大學(xué)出版社,2002.
[2] Fukanaga K,Hostetler L D. The estimation of the gradient of a density function with applications in pattern recognition [J]. IEEE Trans Information Theory,1975,21 (1) .
[3] Y. Cheng,Mean Shift,Mode Seeking and Clustering [J],IEEE Trans. Pattern Analysis and Machine Intelligence,17(8),Aug.1995.
[4] NummiaroK,Koller-Meier E,Van Gool L. An adaptive color-based particle filter[J]. Image and Vision Computing,2002,21(1).
[5] Comaniciu D,Meer P. Mean shift: A robust approach toward feature space analysis [J]. IEEE Trans. on Pattern Analysis and Machine Intelligence,2002,24(5).
[6] Comaniciu D. An algorithm for data-driven band width selection [J].IEEE Trans. on Pattern Analysis and Machine Intelligence,2003,25(2).
[7] 彭寧嵩,楊 杰,劉 志,張風(fēng)超. Mean-Shift跟蹤算法中核函數窗寬的自動(dòng)選取[J]. 軟件學(xué)報. 16(9),2005.
[8] 李鄉儒等. 均值漂移算法的收斂性[J]. 軟件學(xué)報. 16(3),2005.
[9] M. Fashing and C. Tomasi. Mean shift is a bound optimization [J],IEEE Trans. Pattern Anal. Machine Intell,25(3),2005.
[10] Ardizzone Cascia M. Automatic video database indexing and retrieval[J]. Multimedia Tools and Applications,1997: 4(1): 29~56.
轉自《自動(dòng)化博覽》