由於多媒體技術的發展,影象壓縮技術成為影象處理中研究的熱點。編碼壓縮技術的發展,使大容量影象資訊的儲存與傳輸得以實現,並且解決了多媒體等新技術在實際應用中遇到的各種困難。
論文先介紹了當前流行的影象壓縮技術,重點介紹塊截斷編碼技術,先從理論上介紹塊截斷編碼原理,塊截斷編碼是一種有效、快速的數位影像壓縮技術,作為一種經典的影象壓縮編碼,塊截斷編碼技術的實時性很強。論文介紹了兩種塊截斷編碼演演算法,一種是標準的塊截斷編碼演演算法,另外一種是改進的塊截斷演演算法即絕對矩塊截斷演演算法。在影象壓縮效能評價中,常用的準則有客觀保真度與主觀保真度。其中客觀評價主要採用峰值訊雜比(PSNR)和均方誤差(MSE)這兩種方法,主觀評價是指人對影象品質的主觀感覺。論文選取三幅影象,分別用這兩種演演算法對這三種影象進行壓縮,觀察壓縮後影象的品質及每幅影象壓縮時的峰值訊雜比(PSNR)和均方誤差(MSE)來評價這兩種方法。總結這兩種方法各自的特點。
實驗證明,標準的塊截斷影象編碼演演算法快速容易實現,而且它對通道誤碼不敏感,實時性比較強,影象品質比較好;絕對矩塊截斷編碼不僅具備了以上的優點,而且運算處理更加迅速,並且較好的保留了影象的邊緣,獲得了更高的影象品質。
二十世紀末,人類社會開始進入到數位化時代,數位影像技術作為數位技術的重要組成部分,將人們帶入了嶄新的多媒體世界。隨著科學的發展和社會的進步,人們對影象資訊的需求也越來越大。在多媒體計算機系統、電子出版、視訊會議、數位化圖書館等許多領域,數位影像都有著廣泛的應用。然而,大量的影象資料量使得儲存成本越來越高,不能滿足現今網路環境下多媒體通訊的需求。因此,影象編碼應運而生並迅速發展起來。
影象編碼,即影象壓縮,就是在保證一定重構品質的前提下,通過去除影象中的各種冗餘,以儘量少的位元數來表徵影象資訊。傳統的影象編碼是以夏農資訊理論為出發點,用統計概率模型來描述信源[1]。編碼實體是畫素或畫素塊,以消除資料相關冗餘為目的,由此產生的JPEG、MPEG-1、MPEG-2、H.261及H.263等編碼國際標準己經獲得了很大的成功。新一代基於內容的影象編碼方法,充分考慮了資訊接收者的主觀特性、影象資訊的具體含義和重要程度,以消除影象內容為目的,是目前一個較為活躍的研究領域。
一幅影象的數位表示需要很大的位元數。影象壓縮的目的在於降低這個位元數到最小程度並且重現原始影象的忠實樣本。影象壓縮的早期研究是以訊息理論作為指導思想的,並得出許多種壓縮方法。普通壓縮方法的壓縮比為10:1,目前,人視覺的腦機理的研究開拓了影象壓縮技術的新紀元,可使壓縮比達到100:1。
常用的壓縮方法包括冗餘度壓縮法、熵壓縮法、變換編碼、塊截斷編碼等,其中塊截斷編碼雖然壓縮比不高(一般為4:1左右),但是具有簡單、快速、易實現,對通道誤碼不敏感,還能夠獲得較高的影象品質,所以長期以來一直受到人們的重視。特別是在計算機技術很發達的今天,它的實時實現十分容易,塊截斷演演算法,可以用純軟體方式完成對活動影象壓縮,而MPEG等演演算法不能做到這一點。從理論上講,塊截斷演演算法能夠保持訊號樣本的一階矩和二階矩使譯碼影象在一定程度上保持了原影象的區域性統計特性。因此,本文研究塊截斷編碼影象壓縮技術及其實現。
從影象壓縮編碼的發展過程來說,可以分成三個階段:第一代,著重於影象資訊冗餘度的壓縮方法。第二代,著重於影象視覺冗餘資訊的壓縮方法。第三代基於模型的影象壓縮方法。
資料壓縮的理論研究開始於Shannon的資訊理論。1948年Shannon的經典論文《通訊的數學原理》中首次提到了資訊率——失真函數概念,1959年又進一步確立了失真率理論,從而奠定了信源編碼的理論基礎[2]。從此理論出發不難得到資料壓縮的兩種基本途徑:其一,設法改變信源的概率分佈,使其儘可能地非均勻,再用最佳編碼方法使平均碼長逼近信源熵;其二,聯合信源的冗餘度也寓於信源間的相關性之中。去除它們之間的相關性,使之成為或差不多成為不相關信源。
經典方法中的無失真壓縮方法,如Huffman編碼、算術編碼、遊程編碼等,基於上述的基本途徑之一,其壓縮效率都以其熵為上界,故其壓縮比飽和於l0:1左右。有失真壓縮方法,如預測編碼、變換域編碼、混合編碼、向量量化、塊截斷編碼等基於基本途徑之二,同時也大都受資訊熵的約束。
雖然經典方法依據了影象本身固有的統計特性和利用人視覺系統的某些特性進行壓縮編碼,但是利用得還不夠充分,且伴隨著感知生理——心理學的發展,人們越來越清楚地認識到:人的視覺感知特點與統計意義上的資訊分佈並不一致,即統計上需要更多的資訊量才能表徵特徵,對視覺感知可能並不重要。從感知角度來講,無需詳細表徵這部分特徵。這時,壓縮技術的研究就突破了傳統Shannon理論的框架,注重對感知特性的利用,即利用所謂的「感知熵」理論,使得壓縮效率得以極大提高,因此稱其為現代壓縮編碼方法。
伴隨著數學理論,如小波變換、分形幾何理論、數學形態學等以及相關學科,如圖形識別、人工智慧、神經網路、感知生理心理學等的深入發展,新穎高效的現代壓縮方法相繼產生。現代壓縮方法又稱為分析與綜合方法。目前影象壓縮編碼技術的研究除了更好的實現現有的國際標準以外,又出現了許多新的影象編碼方法,主要有多解析度編碼、基於表面描述編碼、模型編碼、人工神經網路編碼、分形幾何編碼、數學形態學編碼等[3]。其中分形影象壓縮和小波影象壓縮是當前研究的熱點。下面針對目前典型的影象壓縮方法進行以下綜述。
1.JPEG壓縮:負責開發靜止影象壓縮標準的「聯合圖片專家組」(Joint Photographic Expert Group,簡稱JPEG),於1989年1月形成了基於自適應DCT的JPEG技術規範的第一個草案,其後多次修改,至1991年形成ISO10918國際標準草案,並在一年後成為國際標準,簡稱JPEG標準[4]。
JPEG演演算法中首先對影象進行分塊處理,一般分成互不重疊的 大小的塊,再對每一塊進行二維離散餘弦變換(DCT)。變換後的係數基本不相關,且係數矩陣的能量集中在低頻區,根據量化表進行量化,量化的結果保留了低頻部分的係數,去掉了高頻部分的係數。量化後的係數按zigzag掃描重新組織,然後進行哈夫曼編碼。JPEG的優點是具有中端和高階位元率上的良好影象品質。缺點是:由於對影象進行分塊,在高壓縮比時產生嚴重的方塊效應;壓縮比不高,小於50。
JPEG壓縮影象出現方塊效應的原因是:一般情況下影象訊號是高度非平穩的,很難用Gauss過程來刻畫,並且影象中的一些突變結構例如邊緣資訊遠比影象平穩性重要,用餘弦基作影象訊號的非線性逼近其結果不是最優的。
針對JPEG在高壓縮比情況下,產生方塊效應,解壓影象較差,近年來提出了不少改進方法,最有效的是下面的兩種方法: DCT零樹編碼、層式DCT零樹編碼。
2.JEPG2000壓縮:JPEG2000是由ISO/IEC JTCISC29標準化小組負責制定的全新靜止影象壓縮標準。一個最大改進是它採用小波變換代替了餘弦變換。2000年3月的東京會議,確定了彩色靜態影象的新一代編碼方式—JPEG2000影象壓縮標準的編碼演演算法[4]。
JPEG2000格式的影象壓縮比,可在現在的JPEG基礎上再提高10%~30%,而且壓縮後的影象顯得更加細膩平滑。對於目前的JPEG標準,在同一個壓縮碼流中不能同時提供有損和無失真壓縮,而在JPEG2000系統中,通過選擇引數,能夠對影象進行有損和無失真壓縮。現在網路上的JPEG影象下載時是按「塊」傳輸的,而JPEG2000格式的影象支援漸進傳輸,這使使用者不必接收整個影象的壓縮碼流。由於JPEG2000採用小波技術,可隨機獲取某些感興趣的影象區域(ROI)的壓縮碼流,對壓縮的影象資料進行傳輸、濾波等操作。
JPEG2000標準適用於各種影象的壓縮編碼。其應用領域將包括Internet、傳真、列印、遙感、行動通訊、醫療、數點陣圖書館和電子商務等。JPEG2000影象壓縮標準將成為21世紀的主流靜態影象壓縮標準。
3.小波變換影象壓縮:小波變換用於影象編碼的基本思想就是把影象根據Mallat塔式快速小波變換演演算法進行多解析度分解。其具體過程為:首先對影象進行多級小波分解,然後對每層的小波係數進行量化,再對量化後的係數進行編碼。小波影象壓縮是當前影象壓縮的熱點之一,已經形成了基於小波變換的國際壓縮標準,如MPEG-4標準,及如上所述的JPEG2000標準。
目前3個最高等級的小波影象編碼分別是嵌入式小波零樹影象編碼(EZW),分層樹中分配樣本影象編碼(SPIHT)和可延伸影象壓縮編碼(EBCOT)。
小波影象壓縮被認為是當前最有發展前途的影象壓縮演演算法之一。小波影象壓縮的研究集中在對小波係數的編碼問題上。在以後的工作中,應充分考慮人眼視覺特性,進一步提高壓縮比,改善影象品質。並且考慮將小波變換與其他壓縮方法相結合。例如與分形影象壓縮相結合是當前的一個研究熱點。
4.分形影象壓縮:1988年,Barnsley通過實驗證明分形影象壓縮可以得到比經典影象編碼技術高几個數量級的壓縮比。1990年,Barnsley的學生A.E.Jacquin提出區域性迭代函數系統理論後,使分形用於影象壓縮在計算機上自動實現成為可能。
分形壓縮主要利用自相似的特點,通過迭代函數系統(Iterated Function System, IFS)實現。其理論基礎是迭代函數系統定理和拼貼定理。
分形影象壓縮把原始影象分割成若干個子影象,然後每一個子影象對應一個迭代函數,子影象以迭代函數儲存,迭代函數越簡單,壓縮比也就越大。同樣解碼時只要調出每一個子影象對應的迭代函數反覆迭代,就可以恢復出原來的子影象,從而得到原始影象。隨著分形影象壓縮技術的發展,越來越多的演演算法被提出,基於分形的不同特徵,可以分成以下幾種主要的分形影象編碼方法:尺碼編碼方法、迭代函數系統方法、A-E-Jacquin的分形方案。
雖然分形影象壓縮在影象壓縮領域還不佔主導地位,但是分形影象壓縮既考慮區域性與區域性,又考慮區域性與整體的相關性,適合於自相似或自仿射的影象壓縮,而自然界中存在大量的自相似或自仿射的幾何形狀,因此它的適用範圍很廣。
近年來塊截斷編碼的研究也取得了可喜的成果。塊截斷編碼(Block Truncation Coding,簡稱BTC)作為一種經典的壓縮方法,雖然比起來現代的壓縮技術壓縮比不高(它的壓縮比一般為4:1左右),編碼效能不如DCT技術,但是因為它具有簡單、快速的實現演演算法,對通道誤碼不敏感,還能夠獲得令人滿意的圖象品質,所以長期以來一直受到人們的重視。特別是在計算機技術很發達的今天,它的實時實現十分容易,在軍事領域和衛星傳輸方面都有很大的應用前景。
1979年,E.J.Delp和0.R.Mitehell最先提出了塊截斷圖象編碼演演算法,此後陸續出現了許多關於塊截斷編碼的改進演演算法和自適應的或混合的塊截斷編碼方案[5]。H.B.Mitehell等人系統地比較了各種塊截斷演演算法效能的優劣和運算複雜度的高低。近年來,塊截斷編碼越來越多的與其他方法結合應用於各個領域。塗國防等人提出了一種新的純軟體視訊編解碼演演算法 ,利用改進的塊截斷編碼和基於一步預測運動估計的運動補償技術 ,該演演算法能夠在現有的普通PC機上實時實現全綵色視訊電話影象序列的編解碼。
王業奎等人提出了一種新的活動影象編碼演演算法,稱為自適應多值量化的亞抽樣塊截斷編碼。模擬結果表明:這種新演演算法比現有的其它同類演演算法有更好的效能,壓縮比為30,訊雜比為35.4dB,影象主觀品質良好,在現有個人計算機上可以用軟體實時實現。
陸哲明等人提出了一種塊截斷編碼的改進演演算法,用一種快速查表法來編碼高低電平,用24個視覺模型來編碼4×4二進位制點陣圖,實驗表明這種方法可以快速編碼和解碼,並且能夠有效的提高壓縮比。
復旦大學計算機系教授薛向陽等人提出了一種改進的塊截斷編碼演演算法,從理論上講,塊截斷編碼演演算法能夠保持訊號樣本的一階矩和二階矩,使譯碼圖象在一定程度上保持了原圖象的區域性統計特性,但是從目前已經提出的各種塊截斷編碼演演算法來看,它們都是二電平量化器,都將圖象量化成高低兩個電平值,因此在譯碼圖象中不可避免地出現方塊失真,特別是在圖象邊緣處出現明顯的階梯現象。為克服這一缺點,用低通濾波器對BTC量化後的二值圖象塊進行平滑,使得塊失真有所改善,實驗表明本方案還能夠明顯提高重建圖象的峰值訊雜比。
T.M. Amarunnishad 等人提出了一種應用模糊邊緣補償運算元改進塊截斷編碼壓縮的方法,改方法用模糊邏輯位元塊來替換傳統塊截斷編碼方法。該模糊邏輯塊是在模糊邊緣影象中使用耶格爾合補充邊緣模糊運算元得到。實驗表明,本方法較傳統塊截斷編碼方法在視覺品質上和峰值訊雜比上都有所改進。
目前有許多基於塊截斷編碼的改進演演算法,分別在提高壓縮率和提高影象的壓縮品質幾個方面有了明顯的進展。
本文主要研究標準的塊截斷編碼演演算法和改進的塊截斷編碼演演算法,並完成對這兩種演演算法的實現。
在過去的20多年裡,微電子、計算機和感測器技術取得了突飛猛進的發展。數位影像的獲取、數位處理、儲存、傳輸、顯示等技術也因此獲得了極大的成功。但是,當前隨著人們對影象、聲音等多媒體資訊的需求越來越大,如果直接把未經壓縮的影象資料用於交換和儲存,那麼資料的大小還是會遠遠超出已有的儲存技術和網路頻寬。不過,把影象資料進行適當的壓縮,則可能使影象資料大小減小几十倍甚至上百倍。顯然,數位影像壓縮有著重大的實用價值和廣闊的發展前景。
影象編碼與壓縮從本質上來說就是對要處理的影象原始資料按一定的規則進行變換和組合,從而達到以儘可能少的程式碼(符號)來表示儘可能多的資料資訊。壓縮通過編碼來實現,或者說編碼帶來壓縮的效果。所以,一般把此項處理稱之為壓縮編碼。例如,一幅512×512、灰度等級為8位元的影象,其資料量為256K位元組。以四通道衛星遙感探測器為例,以此視窗,一個時次即達1M位元組。實際上,衛星遙感探測時,視窗遠大於此,通道遠多於此。如地球同步衛星,探測範圍達全球面積的三分之一。試想,要儲存這些影象資料,該需要多大的儲存空間。在現代通訊中,影象傳輸已成為重要的內容。在工作中除要求裝置可靠、影象保真度高以外,實時性將是重要技術指標之一。很顯然,在通道頻寬、通訊鏈路容量一定的前提下,採用編碼壓縮技術,減少傳輸資料量,是提高通訊速度的重要手段。
可以這樣認為,沒有編碼壓縮技術的發展,大容量影象資訊的儲存與傳輸是難以實現的,多媒體等新技術在實際中的應用也會碰到困難。
數位影像壓縮簡稱影象壓縮,有時又稱為影象壓縮編碼或影象編碼,從物件上看分為靜止影象壓縮和運動影象壓縮。
影象壓縮研究始於1948年,針對電檢視像傳輸而提出的脈衝編碼調變(PCM)原理。20世紀五、六十年代進行的研究限於影象的幀內編碼(如預測法)、子抽樣/內插復原、影象的統計特性和視覺特性等等。從20世紀60年代末開始,正交變換方法和其它方法被陸續提出,並對影象的幀間編碼
(即運動影象編碼)做了初步探討。1969年舉行的首屆「影象編碼會議」表明影象壓縮編碼己作為一個相對獨立的學科出現。1988年是影象壓縮編碼發展極為重要的一年,視訊壓縮標準H261和靜止影象壓縮標準JPEG的框架原理基本確定,分形和神經網路在影象壓縮編碼中取得重要進展,因此,1988年以前主要研究的壓縮編碼方法通常稱為「經典方法」或「傳統方法」,其後提出的具有重要發展前景的方法稱為「現代方法」。
現代編碼方法:
1.模型法編碼:模型編碼將影象訊號看作三維世界中的目標和景物投影到二維平面的產物,而對這一產物的評價是由人類視覺系統的特性決定的。模型編碼的關鍵是對特定的影象建立模型,並根據這個模型確定影象中景物的特徵引數,如運動引數、形狀引數等。解碼時則根據引數和已知模型用影象合成技術重建影象。由於編碼的物件是特徵引數,而不是原始影象,因此有可能實現比較大的壓縮比。模型編碼引入的誤差主要是人眼視覺不太敏感的幾何失真,因此重建影象非常自然和逼真。
2.分形編碼法:分形法是基於物質的自相似性,在編碼時將訊號分解為若干分形子圖,提取其迭代函數系統程式碼(IFS程式碼)。恢復時則由該程式碼按規律迭代重構各子圖。基於IFS的分形法編碼壓縮過程應包括以下步驟:
(1) 將原圖預分割成若干分形子圖,使每一子圖具有一定的分形結構。目前這一步需要採用影象處理、計算機視覺和圖形識別的技術,經過反覆試湊才能完成。
(2) 對每一子圖提取IFS程式碼。即將子圖置於計算機螢幕上,採用伸縮、平移、旋轉或仿射手段,對子圖進行壓縮,獲得一組仿射變換參量,便可得到該子圖的IFS程式碼。
(3) 對IFS程式碼採用經典的編碼方法進行編碼。
(4) 譯碼形成IFS程式碼。
(5) 由IFS程式碼,利用隨機迭代法獲取相應的重構子圖。
(6) 把各重構子圖拼成恢復影象。對於一定的整體與區域性存在明顯相似性或仿射性的分形影象類,這種方法可以取得很高的壓縮比。
3.小波變換壓縮方法:小波變換把影象分解成逼近影象和細節影象之和,它們分別代表影象的不同結構,然後採用快速演演算法(Mallat)進行壓縮,可以獲得很高的壓縮比。基於小波變換的影象壓縮演演算法首先使用某種小波基函數將影象作小波變換,再根據4個通道的不同情況,分別量化編碼,比如對低頻頻段(LL)採用較多的量化級別,而對中間頻段(LH,RH)採用較少量化級別,對高頻頻段(HH)採用很少幾個量化級別,這樣根據重構時對復原訊號的重要程度分別對待的方式可以有效地提高壓縮比而又不產生明顯的失真[6]。小波變換在靜態影象壓縮中的作用已經得到公認,為JPEG2000標準所採納。小波變換應用於影象壓縮時,本質上是對原始影象的小波係數進行重組處理,然後用處理後的小波係數恢復影象,在實際的訊號壓縮標準中(如JPEG2000),一般採用支集長度為9和7的雙正交小波,該方法容錯性比較好,因此更適合實際的應用。
經典編碼方法:
1.行程長度編碼(RLE):行程長度編碼(run-length encoding)是壓縮一個檔案最簡單的方法之一。它的做法是把一系列的重複值(例如影象畫素的灰度值)用一個單獨的值再加上一個計數值來取代。比如有這樣一個字母序列aabbbccccccccdddddd,它的行程長度編碼就是2a3b8c6d。這種方法實現起來很容易,而且對於具有長重複值的串的壓縮編碼很有效。例如對於有大面積的連續陰影或者顏色相同的影象,使用這種方法壓縮效果很好。很多點陣圖檔案格式都用行程長度編碼,例如TIFF,PCX, GEM等。
2 .LZW編碼:LZW編碼原理是將每一個位元組的值都要與下一個位元組的值配成一個字元對,併為每個字元對設定一個程式碼。當同樣的一個字元對再度出現時,就用代號代替這一字元對,然後再以這個代號與下個字元配對。LZW編碼原理的一個重要特徵是,程式碼不僅僅能取代一串同值的資料,也能夠代替一串不同值的資料。在影象資料中若有某些不同值的資料經常重複出現,也能找到一個代號來取代這些資料串。在此方面,LZW壓縮原理是優於RLE的。
3.霍夫曼編碼:霍夫曼編碼(Huffman encoding)是通過用不固定長度的編碼代替原始資料來實現的。霍夫曼編碼最初是為了對文字檔案進行壓縮而建立的,迄今已經有很多變體。它的基本思路是出現頻率越高的值,其對應的編碼長度越短,反之出現頻率越低的值,其對應的編碼長度越長。
4.預測及內插編碼:一般在影象中區域性區域的象素是高度相關的,因此可以用先前的象素的有關灰度知識來對當前象素的灰度進行預計,這就是預測。而所謂內插就是根據先前的和後來的象素的灰度知識來推斷當前象素的灰度情況。如果預測和內插是正確的,則不必對每一個象素的灰度都進行壓縮,而是把預測值與實際象素值之間的差值經過熵編碼後傳送到接收端。在接收端通過預測值加差值訊號來重建原象素。
5.向量量化編碼:向量量化編碼利用相鄰影象資料間的高度相關性,將輸入影象資料序列分組,每一組m個資料構成一個m維向量,一起進行編碼,即一次量化多個點。根據仙農率失真理論,對於無記憶信源,向量量化編碼總是優於標量量化編碼。編碼前,先通過大量樣本的訓練或學習或自組織特徵對映神經網路方法,得到一系列的標準影象模式,每一個影象模式就稱為碼字或碼矢,這些碼字或碼矢合在一起稱為碼書,碼書實際上就是資料庫。輸入影象塊按照一定的方式形成一個輸入向量。編碼時用這個輸入向量與碼書中的所有碼字計算距離,找到距離最近的碼字,即找到最佳匹配影象塊。輸出其索引(地址)作為編碼結果。解碼過程與之相反,根據編碼結果中的索引從碼書中找到索引對應的碼字(該碼書必須與編碼時使用的碼書一致),構成解碼結果。由此可知,向量量化編碼是有損編碼。目前使用較多的向量量化編碼方案主要是隨機型向量量化,包括變換域向量量化,有限狀態向量量化,地址向量量化,波形增益向量量化,分類向量量化及預測向量量化等。
6.塊截斷編碼:1979年,E.J.Delp和0.R.Mitehell提出了塊截斷圖象編碼演演算法,此後陸續出現了許多關於塊截斷編碼的改進演演算法和自適應的或混合的塊截斷編碼方案,最近,H.B.Mitehell等人又系統地比較了各種BTC演演算法效能的優劣和運算複雜度的高低.。
雖然BTC的壓縮比不高(一般為4:1左右),編碼效能不如DCT技術,但是因為它具有簡單、快速的實現演演算法,對通道誤碼不敏感,還能夠獲得令人滿意的圖象品質,所以長期以來一直受到人們的重視.特別是在計算機技術很發達的今天,它的實時實現十分容易,因此本文著重研究塊截斷編碼技術。
塊截斷編碼是一種有效的、快速的有損影象壓縮方法。與向量量化和變換編碼相比,塊截斷編碼更加容易實現。因為它具有運算量低,所需存貯量小,簡單、快速的低複雜度實現演演算法,以及良好的抗通道干擾特性等優點,所以長期以來在實時影象傳輸領域中一直受到人們的重視。實質上塊截斷編碼是一個1位元自適應矩保持(Moment-preserving quantizer)量化器,它能夠保持訊號樣本的一階矩和二階矩,使譯碼影象在一定程度上保持了原影象的區域性統計特性。塊截斷編碼最早由E.J.Delp和O.R.Mitchell於1979年提出,該演演算法保持影象的塊均值和影象的塊標準方差不變。後來,在1984年,Lema和Mitchell提出了一種塊截斷編碼的簡單快速的改進方法,即保持絕對值中心矩不變的塊截斷編碼演演算法(Absolute MomentBTC,AMBTC)[8]。然而標準塊截斷編碼演演算法和絕對矩塊截斷編碼演演算法所能達到的位元率均為2位元/畫素,同時其壓縮比也不高。因此,為了進一步提高壓縮比、減少位元率,並提高重建影象的品質隨後又陸續出現了許多關於塊截斷編碼的改進演演算法和自適應的或混合的塊截斷編碼方案。例如,用中值濾波器,向量量化,插值或預測等方法來對輸出量化器的資料進行編碼。然而,壓縮比的增加,位元率的減少都是以重建影象失真度的增大或演演算法複雜度的增加為代價的。
在標準的塊截斷編碼中,將影象分段成為n×n無重疊影象塊,4×4為典型塊,併為各資料塊而單獨設計的2電平(1bit)量化器。量化門限和二個重建電平隨一個影象塊的區域性統計特徵而變化,因此該編碼實際上是一個區域性二進位制處理過程,這種資料塊的表達方式是由一個n×n位元映像所組成,該n×nbit代表了有關各畫素的重建電平和確定兩個重建電平的附加資訊,而譯碼是個簡單的處理過程,它在作為每位元映像的各畫素位置,選定一個合適的重建值而完成譯碼。