本文將介紹數位影像有關的屬性、特徵等。對各型別檔案影象進行相應瞭解,對數位影像的資料結構、演演算法形式進行介紹,明白影象噪聲與特徵提取
影象數位化是將一幅畫面轉化成計算機能處理的形式——數位影像的過程。
就是把一幅圖畫分割成如圖的一個個小區域(像元或畫素),並將各小區域灰度用整數來表示,形成一幅點陣式的數位影像。它包括取樣和量化兩個過程。
畫素的屬性=( 位置,灰度/顏色)
數位影像用矩陣來描述:以一幅數位影像F左上角畫素中心為座標原點,一幅m × n的數位影像用矩陣表示為:
數位影像根據灰度級數的差異可分為:
黑白影象、灰度影象和彩色影象
取樣
:將空間上連續的影象變換成離散點的操作稱為取樣。
取樣間隔和取樣孔徑的大小是兩個很重要的引數。
當對影象進行實際的抽樣時,怎樣選擇各抽樣點的間隔是個非常重要的問題。影象包含何種程度的細微的深淡變化,取決於希望實際反映影象的程度(還原度)。
量化
:將畫素灰度轉換成離散的整數值的過程。
一幅數位影像中不同灰度值的個數稱為灰度級,用G表示。一般數位影像灰度級數 G 為 2 的整數冪,即
G
=
2
𝑔
G = 2^𝑔
G=2g
,g 為量化 bit 數。若一幅數位影像的量化灰度級數
G
=
256
=
2
8
G = 256 = 2^8
G=256=28 級,灰度值範圍0-255,常稱為8bit量化。
影象資料量:一幅 M×N、灰度級數為 G 的影象所需的儲存空間 M × N × g(bit)為影象資料量。
所謂「均勻」,指的是取樣、量化為等間隔方式。影象數位
化一般採用均勻取樣和均勻量化方式。
非均勻取樣是根據圖象細節的豐富程度改變取樣間距。細節
豐富的地方,取樣間距小,否則間距大。
非均勻量化是對影象層次少的區域採用間隔大量化,而對影象層次豐富的區域採用間隔小量化。
採用非均勻取樣與量化,均會使問題複雜化,因此很少採用
取樣間隔越小,所得影象畫素數越多,空間解析度高,影象品質好,但資料量大;
取樣間隔越大,所得影象畫素數越少,空間解析度低,品質差;
下影象素數從 256×256 遞減至 8×8
量化等級越多,所得影象層次越豐富,灰度解析度越高,品質越好,但資料量大;
量化等級越少,影象層次欠豐富,灰度解析度低,品質變差,會出現假輪廓現象,但資料量小。
下圖為取樣間距相同時灰度級數從256逐次減少為64、16、8、4、2所得影象
數位化器必須能夠將影象劃分為若干畫素並分別給它們地址,能夠度量每一畫素的灰度並量化為整數,能夠將這些整數寫入儲存裝置。
A.取樣孔:保證單獨觀測特定的畫素而不受其它部分的影響。
B.影象掃描機構:使取樣孔按預先確定的方式在影象上移動。
C.光感測器:通過取樣孔測量影象的每一個畫素的亮度。
D.量化器:將感測器輸出的連續量轉化為整數值。
E.輸出儲存體:將畫素灰度值儲存起來。它可以是固態記憶體,或磁碟等。
常用的數位化器是掃描器、數碼相機和數碼攝像機
項 目 | 內 容 |
---|---|
空間解析度 | 單位尺寸能夠取樣的畫素數。由取樣孔徑與間距的大小和可變範圍決定。 |
灰(色)度解析度 | 量化為多少等級(位深度),顏色數(色深度) |
影象大小 | 儀器允許掃描的最大圖幅 |
量測特徵 | 數位化器所測量和量化的實際物理引數及精度 |
掃描速度 | 取樣資料的傳輸速度 |
噪聲 | 數位化器的噪聲水平(應當使噪聲小於影象內的反差) |
其他 | 黑白/彩色,價格,操作效能 |
按影象處理的輸出形式,影象處理的基本功能可分為三種形式。
1)單幅影象 → 單幅影象
2)多幅影象 →單幅影象
3)單(或多)幅影象→ 數位或符號等
對於任一畫素(i,j),該畫素周圍的畫素構成的集合{(i+p,j+q),p、q取合適的整數},叫做該畫素的鄰域。如圖。
常用的鄰域如圖,分別表示中心畫素的4-鄰域、8-鄰域。
對輸入影象IP(i,j)處理時,某一輸出畫素JP(i,j)值由輸入圖
像畫素(i,j)及其鄰域N(IP(i,j))中的畫素值確定。這種處理稱為
區域性處理。
區域性處理的計算表示式為
例如 對一幅圖象採用3×3模板進行折積運算。
在區域性處理中,當輸出值JP(i,j)僅與IP(i,j)有關,則稱為點
處理。
點處理的計算表示式為:
在區域性處理中,輸出畫素JP(i,j)的值取決於輸入影象大範圍或全部畫素的值,這種處理稱為大局處理。
大局處理計算表示式為:
反覆對影象進行某種運算直至滿足給定的條件,從而得到輸出影象的處理形式稱為迭代處理。影象的細化處理過程如圖:
選擇滿足適當條件的畫素作為起始畫素,檢查輸入影象和已
得到的輸出結果,求出下一步應該處理的畫素,進行規定的處理,然後決定是繼續處理下面的畫素,還是終止處理。這種處理形式稱為跟蹤處理
對影象的處理,一般採用對整個畫面進行處理,但也有隻對
畫面中特定的部分進行處理的情況。這種處理方式的代表有視窗處理和模板處理。
單獨對影象中選定的矩形區域內的畫素進行處理的方式叫做視窗處理
希望單獨處理任意形狀的區域時,可採用模板處理。
模板:任意形狀的區域;
模板平面:一個和處理影象相同大小的二維陣列,用來儲存模板資訊。一般是一幅二值影象;
模板處理:邊參照模板平面邊對圖象進行某種操作
若模板成矩形區域,則與視窗處理具有相同的效果,但視窗處理與模板處理不同之處是後者必須設定一個模板平面
①序列處理
後一畫素輸出結果依賴於前面畫素處理的結果,並且只能依次處理各畫素而不能同時對各畫素進行相同處理的一種處理形式。
特點:用輸入影象的第(i,j)畫素鄰域的畫素值和輸出影象(i,j)以前畫素的處理結果計算輸出影象(i,j)畫素的值。
處理演演算法要按一定順序進行。
②並行處理
對影象內的各畫素同時進行相同形式運算的一種處理形式。
特點:輸出影象畫素(i,j)的值,只用輸入影象的(i,j)畫素的鄰域畫素進行計算。各輸出值可以獨立進行運算
從灰度直方圖能獲取影象哪些資訊?
以灰度級為橫座標,頻率為縱座標,繪製頻率同灰度級的關係圖就是一幅灰度影象的直方圖,它反映了一幅影象中各灰度級畫素出現的頻率與灰度級的關係和影象灰度分佈的狀況;灰度直方圖只能反映影象的灰度的範圍和分佈情況,而不能反映影象畫素的位置,即丟失了畫素的位置資訊。一幅影象對應唯一的灰度直方圖,反之不成立。不同的影象可對應相同的直方圖;明亮影象的直方圖傾向於灰度值較大的右邊一側,暗影象的直方圖傾向於在灰度值較小的左邊一側,對比度較低的影象對應的直方圖窄而集中於灰度級的中部,對比度高的影象對應的直方圖分佈範圍很寬而且分佈均勻,因此,直方圖可以反映影象的清晰程度,當直方圖分佈均勻時,影象最清晰。
當直方圖分佈均勻時,影象最清晰
影象的特徵有很多,按提取特徵的範圍大小又可分為:
①點特徵
僅由各個畫素就能決定的性質。如單色影象中的灰度值、彩色影象中的紅®、綠(G)、藍(B)成分的值。
②區域性特徵
在小鄰域內所具有的性質,如線和邊緣的強度、方向、密度和統計量(平均值、方差等)等。
③區域特徵
在影象內的物件物 (一般是指與該區域外部有區別的具有一定性質的區域)內的點或者區域性的特徵分佈,或者統計量,以及區域的幾何特徵(面積、形狀)等。
④整體特徵
整個影象作為一個區域看待時的統計性質和結構特徵等
獲取影象特徵資訊的操作稱作特徵提取。它作為圖形識別、影象理解或資訊量壓縮的基礎是很重要的。通過特徵提取,可以獲得特徵構成的影象(稱作特徵影象)和特徵引數。
把從影象提取的m個特徵量 𝑦 1 , 𝑦 2 , … , 𝑦 𝑚 𝑦_1 ,𝑦_2, …,𝑦_𝑚 y1,y2,…,ym,用 m 維的向量 Y = [ 𝑦 1 𝑦 2 … 𝑦 𝑚 ] 𝑡 Y=[𝑦_1 𝑦_2 … 𝑦_𝑚]^𝑡 Y=[y1y2…ym]t 表示稱為特徵向量。另外,對應於各特徵量的m維空間叫做特徵空間。
①外部噪聲。如天體放電干擾、電磁波從電源線竄入系統等產生的噪聲。
②內部噪聲。系統內部產生,主要包括四種:由光和電的基本性質引起的、機械運動產生的噪聲、元器件噪聲、系統內部電路噪聲。
對灰度影象 f ( x , y ) f(x,y) f(x,y) 來說,可看做二維亮度分佈,則噪聲可看做對亮度的干擾,用 n ( x , y ) n(x,y) n(x,y) 表示。常用統計特徵來描述噪聲,如均值、方差(交流功率)、總功率等。
按噪聲對影像的影響可分為加性噪聲模型和乘性噪聲模型兩大類。設 f ( x , y ) f(x,y) f(x,y) 為理想影象, n ( x , y ) n(x,y) n(x,y) 為噪聲, 實際輸出影象為 g ( x , y ) g(x,y) g(x,y)。
① 加性噪聲,與影象光強大小無關
g
(
x
,
y
)
=
f
(
x
,
y
)
+
n
(
x
,
y
)
g(x,y)= f(x,y)+ n(x,y)
g(x,y)=f(x,y)+n(x,y)
② 乘性噪聲,與影象光強大小相關,隨亮度大小變化而變化。
g
(
x
,
y
)
=
f
(
x
,
y
)
[
1
+
n
(
x
,
y
)
]
g(x,y)=f(x,y)[1+ n(x,y)]
g(x,y)=f(x,y)[1+n(x,y)]
①光電管噪聲
②攝像管噪聲
③前置放大器噪聲
④光學噪聲
影象數位結構是指影象畫素灰度值的儲存方式,常用方式是將影象各畫素灰度值用一維或二維陣列相應的各元素加以儲存。
此外,其他方式:
1.組合方式
2.位元面方式
3.分層結構
4.樹結構
5.多重影象資料儲存
方法:一個字長存放多個畫素灰度值。
特點:節省記憶體,但計算量增加,處理程式複雜
將所有畫素灰度的相同位元位用一個二維陣列表示,形成位元面。n 個位元位表示的灰度影象按位元面方式存取,就得到 n 個位元面。
特點:能充分利用記憶體空間,便於進行位元面之間的運算,但對灰度影象處理耗時多。
錐形結構:對 2 k × 2 k 2^k×2^k 2k×2k 個畫素形成的影象,依次構成解析度下降的 k + 1 k+1 k+1 幅影象的層次集合。
方法:從原影象 I 0 I_0 I0 開始,依次產生行列畫素數都變為1/2的一幅幅的影象 I 1 , I 2 , . . . , I k I_1, I_2, ..., I_k I1,I2,...,Ik。此時,作為影象 I i I_i Ii 的各畫素的值,就是它前一個影象 I ( i − 1 ) I_(i-1) I(i−1)的相應的 2×2 畫素的灰度的平均值。
優點:先對低解析度影象進行處理,然後根據需要對高解析度影象進行處理,可提高效率
對於如圖所示的一幅二值影象的行、列接連不斷地二等分,如果影象被分割部分中的全體畫素都變成具有相同的特徵時,這一部分則不再分割。
用這種方法,可以把影象用樹結構(4叉樹)表示。這可以用在特徵提取和資訊壓縮等方面
對於彩色影象或多波段影象而言,每個畫素包含著多個波段的資訊。
儲存方式有三種:
(1)逐波段儲存,分波段處理時採用。
(2)逐行儲存,逐行掃描記錄裝置採用。
(3)逐畫素儲存,用於分類
按不同的方式進行組織或儲存數位影像畫素的灰度,就得到不同格式的影象檔案。影象檔案按其格式的不同具有相應的擴充套件名。常見的影象檔案格式按擴充套件名分為:RAW格式、BMP格式、TGA格式、PCX格式、GIF格式、TIFF格式等。這些影象格式都大致包含下列特徵:
(1)描述影象的高度、寬度以及各種物理特徵的資料。
(2)彩色定義
(3)描述影象的點陣圖資料體
下面只對BMP格式作較詳細介紹,其他格式只做簡介
它是將畫素按行列號順序儲存在檔案中。這種文
件只含有影象畫素資料,不含有資訊頭,因此,
在讀影象時,需要事先知道影象大小(矩陣大
小)。它是最簡單的一種影象檔案格式。
由以下四個部分組成
1)14位元組的檔案頭;
2)40位元組的資訊頭;
3)8位元組的顏色定義;
4)點陣圖資料
1)點陣圖檔案頭BITMAPFILEHEADER
它的結構如下:
typedef struct tagBITMAPFILEHEADER{
WORD bfType; /*指定檔案型別,必須是0x424D,即字串「BM」 */
DWORD bfSize; /*指定檔案大小 */
WORD bfReserved1;為/*保留字 */
WORD bfReserved2; /*保留字 */
DWORD bfOffBits;為/*檔案頭到實際的點陣圖資料的偏移位元組數 * /
}BITMAPFILEHEADER, FAR *LPBITMAPFILEHEADER;
該結構的長度是固定的,為14個位元組 。
2)點陣圖資訊頭BITMAPINFOHEADER
結構的長度為40個節 , 其結構如下:
typedef struct tagBITMAPINFOHEADER{
DWORD bfSize; /* 指定這個結構的大小,為40個位元組
LONG biWidth; /*指定影象的寬度,單位是畫素
LONG biHeight; /*指定影象的高度,單位是畫素;
WORD biPlanes; /*必須是1
WORD biBitCount; /*指定表示顏色位數,1(黑白)8(256色)、24(真彩色)
DWORD biCompression; /*指定是否壓縮,分別為BI_RGB、BI_RLE4、BI_RLE8
DWORD biSizeImage; /*指定實際的點陣圖資料佔用的位元組數。
LONG biXPelsPerMeter; /*指定目標裝置的水平解析度
LONG biYPersPerMeter; /*指定目標裝置的垂直解析度
DWORD biClrUsed; /*指定本影象實際用到的顏色數
DWORD biClrImportant; /*指定本影象中重要的顏色數
}BITMAPINFOHEADER, FAR *LPBITMAPINFOHEADER;
3)palette(調色盤)
調色盤實際上是一個陣列 ,陣列中每個元素的型別為一個
RGBQUAD結構,佔4個位元組。結構定義如下:
typedef struct tagRGBQUAD{
BYTE rgbBlue;
BYTE rgbGreen;
BYTE rgbRed;
BYTE rgbReserved;
}RGBQUAD;
有些點陣圖,比如真彩色圖,沒有調色盤。他們的點陣圖資訊頭
後直接是點陣圖資料。
4)點陣圖資料
它分兩種情況:對於用到調色盤的點陣圖,影象資料就是該像
素顏色在調色盤中的索引值;對於真彩色圖,影象資料就是實
際的R、G、B值。
a)點陣圖是1,4,8位元時,有調色盤。
對於2色點陣圖,用1位就可以表示該畫素的顏色,因此一個位元組可以表示8個畫素;
對於16色點陣圖,用4位元可以表示一個畫素的顏色,所以1個位元組可以表示2個畫素;
對於256色點陣圖,一個位元組剛好表示一個畫素;
b) 點陣圖是24位元(真彩色)時,無調色盤。
對於真彩色圖,3個位元組才能表示1個畫素。
GIF影象是基於顏色列表的,最多支援8位元。GIF
支援在一幅GIF檔案中存放多幅彩色影象,並且
可以按照一定的順序和時間間隔將多幅影象依次
讀出並顯示在螢幕上,這樣就可以形成一種簡單
的動畫效果。
GIF一般有七個資料區組成:標頭檔案、通用調色
板、點陣圖資料區以及四個擴充區。
TIFF影象檔案主要由三部分組成:檔案頭、標識
資訊區和影象資料區