半導電紙

[拼音]:zifu bianma

[英文]:code

在符號集合與數字系統之間建立對應關係,它是資訊處理的一項基本技術。通常人們用符號集合(一般情況下就是文字)來表達資訊。而以計算機為基礎的資訊處理系統則是利用元件(硬體)不同狀態的組合來儲存和處理資訊的。元件不同狀態的組合能代表數字系統的數字,因此編碼就是將符號轉換為計算機可以接受的數字系統的數,稱為數字程式碼。例如,數碼管有10個狀態,分別表示從0到9的10個數字,可以構成一個十進位制數字系統。由26個英文字母A、B、C、…、Z組成的符號集合可用兩位十進位制數來編碼:A呏01,B呏02,C呏03,…,Z呏26。符號集合有26個元素,而兩位十進位制數字系統有100個元素,其中有74個元素沒有使用。雙穩態元件可以構成二進位制數字系統,既經濟效率又高,便於用積體電路實現,為計算機所採用。

編碼的方式很多,但都應當滿足下述要求:

(1)符號之間的某種關係應當在相應的編碼中有所反映。例如,字母表中有個順序關係:A在B之前,B在C之前等,可對應編碼的大小關係:01<02,02<03等。

(2)作用於符號的操作和對應的作用於數的操作能產生相對應的結果。例如,要找出B、E、A、C中排在字母表最前面位置的字母和在02(對應B),05(對應E),01(對應A),03(對應C)中找出數值最小的數,這兩種操作會得到相對應的結果A和01。

(3)表達方式應當是高效率的,能夠縮小數字系統的體積,減少浪費。

十進位制數碼的二進位制表示法

十進位制數碼的符號一共有10個,即0,1,9,可用4位二進位制數碼或4位以上的二進位制數碼來表示。主要的方法是加權編碼,在每個二進位制數碼上給予不同的權。例如用 4位二進位制數對一位十進位制數進行編碼:

D呏b4b3b2b1

其中D是十進位制數碼符號0~9,bi是二進位制數碼0或1,可規定 4個權,W1、W2、W3、W4同b1、b2、b3、b4對應。這時,十進位制數碼D同二進位制數的對應規律為:

D=

biWi=b4W4+b3W3+b2W2+b1W1

如果兩個不同的二進位制數對應同一個D,則要附加一條規則來決定究竟用哪一個數。常用的4位編碼(表1)有以下幾種:

(1)8421碼從左到右的權為8、4、2、1。這種表示和二進位制表示是一致的,又稱二進位制編碼的十進位制,簡稱BCD碼。

(2)7421碼從左到右的權為7、4、2、1。此時數字7對應於兩個二進位制數1000和0111,所以要附加一條規則,即挑選其中1的個數少的一個,即選1000為數字7的編碼。

(3)742-1碼其中最右邊的一個權取負值。此時數字6對應兩個二進位數1001和0110,附加規則為挑選其中有較低有效數的一個,即選1001為數字6的編碼。

(4)XS3碼(XS3是英文excess-3的縮寫,即加三碼)在BCD碼的基礎上加上二進位制數0011,即加上十進位制的三。

常用檢錯編碼

編碼位數多的好處是便於檢查差錯,編碼的結構簡單,由硬體實現起來也容易。常用檢錯編碼(表2)有4種。

(1)五取二碼取5位二進位制數碼,每個數中包含兩個1。

(2)二元五進碼(BQ碼)取7位二進數碼,分成左右兩部分,左面兩位,右面五位。每個數中包含兩個1,一個在左部,一個在右部。出錯檢查很容易,只要左部或右部出現1的個數不為一時,肯定有錯。這種編碼硬體實現也較容易。

(3)改進的二元五進碼(MBQ碼)取 4位二進位制數碼,最左一位對應二元五進碼左部,右面三位對應它的右部,權為5421。

(4)格雷碼因由 F.格雷發明而得名。他調整二進位數的次序,使兩相鄰的數碼只有一位不同。它能滿足特殊情況下的要求,即把機械位移量轉換成二進位制編碼時可得到較高的可靠性。

字母表的二進位制數表示

完全的字母表一般包括下列符號:拉丁字母A~Z,數字0~9,標點符號,特殊符號如&、 @、$ 、¥ 、…。 字母還可分大寫和小寫,另外還有許多控制用符號,並考慮到擴充的可能性。符號的總數不超過256個。一個符號可以用8位二進位制數來表示。主要的編碼方式有3種。

(1)霍勒裡思碼一種IBM機器穿孔卡片的編碼形式。每張卡片80列,12行。每列表示一個符號,用12位。

(2)擴充的二進位制編碼的十進位制交換碼(EBCDIC碼)IBM開發的8位編碼,適用於IBM360和IBM370等計算機。

(3)美國標準資訊交換碼(ASCII碼)實際上是 7位碼,附加一位校驗碼,一共8位。

漢字編碼

漢字字元多、數量大,過去的編碼系統雜亂繁複,使用與維護極不方便。這種情況給漢字資訊處理系統的軟體與硬體的設計和製造帶來很大困難,嚴重阻礙漢字資訊處理技術的發展。1980年中國公佈了國家標準《漢字交換碼,基本集》即國家標準GB2312-80資訊交換用漢字編碼符基本集。標準於1981年5月1日起開始執行。標準規定了資訊交換用的基本圖形字元及其二進位制編碼表示,它適用於一般漢字處理,漢字通訊系統之間的資訊交換。

這一標準集規定了一般符號、序號、數字、拉丁字母、漢字等共7445個圖形字元。其中一般符號202個,序號60個,數字22個,拉丁字母52個,日文假名169個,希臘字母48個,俄文字母66個,漢語拼音符號26個,漢語注音字母37個,漢字6763個。根據使用頻度,將漢字分為兩級,第一級漢字3755個,按漢語拼音字母順序排列,第二級漢字3008個,按部首排列。