動量傳遞

[拼音]:tuxiang bianma

[英文]:image coding

模擬影象訊號的數字化和相應的影象頻帶壓縮技術。模擬影象訊號數字化是對訊號在時間上抽樣、幅度上分層並轉換為數碼的過程。這一典型的數字化過程大大增加對傳輸通道容量的要求。因此,在影象數字化的同時,往往必須進行頻帶壓縮。只有將影象數字化後對傳輸通道容量的要求降低到接近於、甚至小於影象模擬傳輸時的數值,影象的數字傳輸才有可能得到廣泛應用。

效能度量

收信端重建影象的質量,用相對於原始影象的失真來衡量。失真的客觀量度,一般用原始影象樣值與經過影象編碼後在收信端重建影象樣值間的均方誤差表示。失真的主觀度量是人的視覺感受,它是對再生影象質量有決定意義的評價。在研究影象編碼時,往往同時採用主觀和客觀失真度量。

活動影象可看成是由平面座標i,j以及時間座標t決定的三維空間內的亮度分佈。同一平面內相鄰畫素(亦稱像元)間以及相鄰時間的各幀畫素間存在相關性,因而數字影象資訊具有冗餘度。實現影象編碼的基本途徑是通過對影象訊號樣值去相關來消除資訊的冗餘度。這也就是利用影象訊號樣值間的相關性來實現影象的頻帶壓縮。

影象編碼的指標由平均每個樣本的編碼位元數來衡量,這一數值的降低取決於編碼方案是否能充分地去掉相關性。由於實際影象是一個非平穩過程,它的區域性統計相關性隨著影象各區域性內容細節及活動量而變化。自適應影象編碼能夠根據影象區域性統計相關性的變化,自動採用不同的引數甚至在不同的影象編碼方案間切換,從而做到充分去除影象每一區域性範圍內的相關性。

頻帶壓縮後的影象訊號降低了資訊冗餘度,但一旦當通道產生誤碼,傳輸的資訊就容易受到破壞。因此,影象編碼的總效能應該用重建影象主客觀失真、平均每樣本編碼位元數以及對通道誤碼靈敏度來表示。它們之間往往是相互制約的。

影象編碼方案

影象編碼系統的發信端基本上由兩部分組成。首先,對經過高精度模-數變換的原始數字影象進行去相關處理,去除資訊的冗餘度;然後,根據一定的允許失真要求,對去相關後的訊號編碼即重新碼化(圖1)。一般用線性預測和正交變換進行去相關處理;與之相對應,影象編碼方案也分成預測編碼和變換域編碼兩大類。

預測編碼

預測編碼利用線性預測逐個對影象資訊樣本去相關。對某個畫素S0來說,它用鄰近一些畫素亮度的加權和(線性組合)┈作為估值,對S0進行預測(圖2a)。S0與┈之間的差值e(u)就是預測誤差。由於相鄰畫素與S0間存在相關性,差值的統計平均能量就變得很小。因此,只需用少量數碼就可以實現差值影象的傳輸。

影象預測編碼(差值脈碼調製)主要有三種預測方法。

(1)一維固定預測(一維差值脈碼調製):用圖2a中的S1或S2對S0預測,加權係數固定並且小於1。

(2)二維固定預測(二維差值脈碼調製):當預測估值取S1和S2的平均時,稱之為二維平均預測,而當預測估值取┈=S1+S2-S3時,稱之為二維平面預測。

(3)條件傳輸幀間預測(幀差脈碼調製):用前一幀同一平面位置的畫素作為預測估值。對於只有少量活動的影象(如可視電話),畫面中約有百分之七十以上的幀間差值等於零或很小,因此這些差值可捨棄不傳。由於幀間差值的傳輸以其幅度是否大於某個閾值為條件,又稱為條件傳輸幀間預測。

變換域編碼

用一維、二維或三維正交變換對一維n、二維n×n、三維n×n×n塊中的影象樣本的集合去相關,得到能量分佈比較集中的變換域;在再碼化時,根據變換域中變換系數能量大小分配數碼,就能壓縮頻帶。最常用的正交變換是離散餘弦變換(DCT),n值一般選為8或16。三維正交變換同時去除了三維方向的相關性,它可以壓縮到平均每樣本1位元。

影象編碼可應用於基本靜止圖片的數字傳輸、數字電視電話會議以及數字彩色廣播電視。相應的壓縮目標,即傳輸數位元速率範圍,初步定為64千位元/秒、2兆位元/秒、8兆位元/秒和 34兆位元/秒級。雖然壓縮效能較高的影象編碼方案需要進行復雜的多維數字處理,但隨著數字大規模積體電路的整合度和工作速度的提高,以及大容量傳輸通道的實現,數字影象傳輸必將逐步從實驗方案進入實用階段。

參考書目

W.K.Pratt,Digital Image Processing, John Wiley & Sons, New York,1978.