本文分享自華為雲社群《[Python從零到壹] 五十八.影象增強及運算篇之影象銳化Sobel、Laplacian運算元實現邊緣檢測》,作者: eastmount 。
Sobel運算元是一種用於邊緣檢測的離散微分運算元,它結合了高斯平滑和微分求導。該運算元用於計算影象明暗程度近似值,根據影象邊緣旁邊明暗程度把該區域內超過某個數的特定點記為邊緣。Sobel運算元在Prewitt運算元的基礎上增加了權重的概念,認為相鄰點的距離遠近對當前畫素點的影響是不同的,距離越近的畫素點對應當前畫素的影響越大,從而實現影象銳化並突出邊緣輪廓[1-4]。
Sobel運算元的邊緣定位更準確,常用於噪聲較多、灰度漸變的影象。其演演算法模板如公式(1)所示,其中dx表示水平方向,dy表示垂直方向[3]。
其畫素計算公式如下:
Sobel運算元畫素的最終計算公式如下:
Sobel運算元根據畫素點上下、左右鄰點灰度加權差,在邊緣處達到極值這一現象檢測邊緣。對噪聲具有平滑作用,提供較為精確的邊緣方向資訊。因為Sobel運算元結合了高斯平滑和微分求導(分化),因此結果會具有更多的抗噪性,當對精度要求不是很高時,Sobel運算元是一種較為常用的邊緣檢測方法。
Python和OpenCV將Sobel運算元封裝在Sobel()函數中,其函數原型如下所示:
– src表示輸入影象
– dst表示輸出的邊緣圖,其大小和通道數與輸入影象相同
– ddepth表示目標影象所需的深度,針對不同的輸入影象,輸出目標影象有不同的深度
– dx表示x方向上的差分階數,取值1或 0
– dy表示y方向上的差分階數,取值1或0
– ksize表示Sobel運算元的大小,其值必須是正數和奇數
– scale表示縮放導數的比例常數,預設情況下沒有伸縮係數
– delta表示將結果存入目標影象之前,新增到結果中的可選增量值
– borderType表示邊框模式,更多詳細資訊查閱BorderTypes
注意,在進行Sobel運算元處理之後,還需要呼叫convertScaleAbs()函數計算絕對值,並將影象轉換為8位元圖進行顯示。其演演算法原型如下:
– src表示原陣列
– dst表示輸出陣列,深度為8位元
– alpha表示比例因子
– beta表示原陣列元素按比例縮放後新增的值
Sobel運算元的實現程式碼如下所示。
# -*- coding: utf-8 -*- # By:Eastmount import cv2 import numpy as np import matplotlib.pyplot as plt #讀取影象 img = cv2.imread('luo.png') lenna_img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB) #灰度化處理影象 grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) #Sobel運算元 x = cv2.Sobel(grayImage, cv2.CV_16S, 1, 0) #對x求一階導 y = cv2.Sobel(grayImage, cv2.CV_16S, 0, 1) #對y求一階導 absX = cv2.convertScaleAbs(x) absY = cv2.convertScaleAbs(y) Sobel = cv2.addWeighted(absX, 0.5, absY, 0.5, 0) #用來正常顯示中文標籤 plt.rcParams['font.sans-serif']=['SimHei'] #顯示圖形 titles = ['原始影象', 'Sobel運算元'] images = [lenna_img, Sobel] for i in range(2): plt.subplot(1,2,i+1), plt.imshow(images[i], 'gray') plt.title(titles[i]) plt.xticks([]),plt.yticks([]) plt.show()
其執行結果如圖1所示:
拉普拉斯(Laplacian)運算元是n維歐幾里德空間中的一個二階微分運算元,常用於影象增強領域和邊緣提取。它通過灰度差分計算鄰域內的畫素,基本流程是:
在演演算法實現過程中,Laplacian運算元通過對鄰域中心畫素的四方向或八方向求梯度,再將梯度相加起來判斷中心畫素灰度與鄰域內其他畫素灰度的關係,最後通過梯度運算的結果對畫素灰度進行調整[2]。
一個連續的二元函數f(x,y),其拉普拉斯運算定義為:
Laplacian運算元分為四鄰域和八鄰域,四鄰域是對鄰域中心畫素的四方向求梯度,八鄰域是對八方向求梯度。其中,四鄰域模板如公式(5)所示:
其畫素的計算公式可以簡化為:
通過模板可以發現,當鄰域內畫素灰度相同時,模板的折積運算結果為0;當中心畫素灰度高於鄰域內其他畫素的平均灰度時,模板的折積運算結果為正數;當中心畫素的灰度低於鄰域內其他畫素的平均灰度時,模板的折積為負數。對摺積運算的結果用適當的衰弱因子處理並加在原中心畫素上,就可以實現影象的銳化處理。
Laplacian運算元的八鄰域模板如下:
其畫素的計算公式可以簡化為:
Python和OpenCV將Laplacian運算元封裝在Laplacian()函數中,其函數原型如下所示:
– src表示輸入影象
– dst表示輸出的邊緣圖,其大小和通道數與輸入影象相同
– ddepth表示目標影象所需的深度
– ksize表示用於計算二階導數的濾波器的孔徑大小,其值必須是正數和奇數,且預設值為1,更多詳細資訊查閱getDerivKernels
– scale表示計算拉普拉斯運算元值的可選比例因子。預設值為1,更多詳細資訊查閱getDerivKernels
– delta表示將結果存入目標影象之前,新增到結果中的可選增量值,預設值為0
– borderType表示邊框模式,更多詳細資訊查閱BorderTypes
注意,Laplacian運算元其實主要是利用Sobel運算元的運算,通過加上Sobel運算元運算出的影象x方向和y方向上的導數,得到輸入影象的影象銳化結果。
同時,在進行Laplacian運算元處理之後,還需要呼叫convertScaleAbs()函數計算絕對值,並將影象轉換為8位元圖進行顯示。其演演算法原型如下:
– src表示原陣列
– dst表示輸出陣列,深度為8位元
– alpha表示比例因子
– beta表示原陣列元素按比例縮放後新增的值
當ksize=1時,Laplacian()函數採用3×3的孔徑(四鄰域模板)進行變換處理。下面的程式碼是採用ksize=3的Laplacian運算元進行影象銳化處理,其程式碼如下:
# -*- coding: utf-8 -*- # By:Eastmount import cv2 import numpy as np import matplotlib.pyplot as plt #讀取影象 img = cv2.imread('luo.png') lenna_img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB) #灰度化處理影象 grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) #拉普拉斯演演算法 dst = cv2.Laplacian(grayImage, cv2.CV_16S, ksize = 3) Laplacian = cv2.convertScaleAbs(dst) #用來正常顯示中文標籤 plt.rcParams['font.sans-serif']=['SimHei'] #顯示圖形 titles = ['原始影象', 'Laplacian運算元'] images = [lenna_img, Laplacian] for i in range(2): plt.subplot(1,2,i+1), plt.imshow(images[i], 'gray') plt.title(titles[i]) plt.xticks([]),plt.yticks([]) plt.show()
其執行結果如圖2所示:
邊緣檢測演演算法主要是基於影象強度的一階和二階導數,但導數通常對噪聲很敏感,因此需要採用濾波器來過濾噪聲,並呼叫影象增強或閾值化演演算法進行處理,最後再進行邊緣檢測。下面是採用高斯濾波去噪和閾值化處理之後,再進行邊緣檢測的過程,並對比了四種常見的邊緣提取演演算法。
# -*- coding: utf-8 -*- # By:Eastmount import cv2 import numpy as np import matplotlib.pyplot as plt #讀取影象 img = cv2.imread('luo.png') lenna_img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) #灰度化處理影象 grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) #高斯濾波 gaussianBlur = cv2.GaussianBlur(grayImage, (3,3), 0) #閾值處理 ret, binary = cv2.threshold(gaussianBlur, 127, 255, cv2.THRESH_BINARY) #Roberts運算元 kernelx = np.array([[-1,0],[0,1]], dtype=int) kernely = np.array([[0,-1],[1,0]], dtype=int) x = cv2.filter2D(binary, cv2.CV_16S, kernelx) y = cv2.filter2D(binary, cv2.CV_16S, kernely) absX = cv2.convertScaleAbs(x) absY = cv2.convertScaleAbs(y) Roberts = cv2.addWeighted(absX, 0.5, absY, 0.5, 0) #Prewitt運算元 kernelx = np.array([[1,1,1],[0,0,0],[-1,-1,-1]], dtype=int) kernely = np.array([[-1,0,1],[-1,0,1],[-1,0,1]], dtype=int) x = cv2.filter2D(binary, cv2.CV_16S, kernelx) y = cv2.filter2D(binary, cv2.CV_16S, kernely) absX = cv2.convertScaleAbs(x) absY = cv2.convertScaleAbs(y) Prewitt = cv2.addWeighted(absX,0.5,absY,0.5,0) #Sobel運算元 x = cv2.Sobel(binary, cv2.CV_16S, 1, 0) y = cv2.Sobel(binary, cv2.CV_16S, 0, 1) absX = cv2.convertScaleAbs(x) absY = cv2.convertScaleAbs(y) Sobel = cv2.addWeighted(absX, 0.5, absY, 0.5, 0) #拉普拉斯演演算法 dst = cv2.Laplacian(binary, cv2.CV_16S, ksize = 3) Laplacian = cv2.convertScaleAbs(dst) #效果圖 titles = ['Source Image', 'Binary Image', 'Roberts Image', 'Prewitt Image','Sobel Image', 'Laplacian Image'] images = [lenna_img, binary, Roberts, Prewitt, Sobel, Laplacian] for i in np.arange(6): plt.subplot(2,3,i+1),plt.imshow(images[i],'gray') plt.title(titles[i]) plt.xticks([]),plt.yticks([]) plt.show()
輸出結果如圖3所示。其中,Laplacian運算元對噪聲比較敏感,由於其演演算法可能會出現雙畫素邊界,常用來判斷邊緣畫素位於影象的明區或暗區,很少用於邊緣檢測;Robert運算元對陡峭的低噪聲影象效果較好,尤其是邊緣正負45度較多的影象,但定位準確率較差;Prewitt運算元對灰度漸變的影象邊緣提取效果較好,而沒有考慮相鄰點的距離遠近對當前畫素點的影響;Sobel運算元考慮了綜合因素,對噪聲較多的影象處理效果更好。
本文主要介紹影象銳化和邊緣檢測知識,詳細講解了Sobel運算元和Laplacian運算元,並通過小珞珞影象進行邊緣輪廓提取。影象銳化和邊緣提取技術可以消除影象中的噪聲,提取影象資訊中用來表徵影象的一些變數,為影象識別提供基礎。