城鎮供水效益
[拼音]:zhongwen xinxi chuli xitong
[英文]:Chinese information processing systems
具備中文資訊處理能力的計算機資訊處理系統。所謂中文資訊一般指漢字資訊。漢字是一種形聲文字,字元的數量很大,不像西文資訊那樣只用幾十個字母的字符集就能表示,因此中文資訊處理系統是建立在大字符集基礎上的資訊處理系統。這種系統應具備一個使用方便的漢字輸入系統、能進行編輯排版的漢字輸出系統、能處理漢字資料型別的各種處理程式。為了能夠保留西文資訊處理系統的全部功能和應用所有成熟的軟體產品,就要使中文資訊處理系統與西文資訊處理系統相容。
漢字輸入系統
將漢字輸入並轉變為計算機內部編碼的系統。輸入方式可分為大鍵盤式(整字輸入)、中鍵盤式(字根部首拼字輸入)和小鍵盤式(編碼輸入)。小鍵盤指標準的西文計算機鍵盤,包括26個字母鍵、10個數字鍵、若干常用標點符號鍵和一些特殊功能鍵。由於鍵數少,有利於盲打,小鍵盤生產工藝成熟穩定,造價便宜,便於普及推廣。漢字編碼有多種方式,歸納起來可分為三類:字形碼(筆劃、部首、字根及角形等)、字音碼、音形碼。中國目前字形碼的方案較多。由於不同的人對各種編碼方案的適應能力也不相同,因此,漢字資訊處理系統往往採用多種輸入方式相容的輸入子系統。使用者可根據自已的習慣選用不同的輸入方式。
大鍵盤模擬中文打字機字盤的構造,一字一鍵,採用機械結構或筆觸式結構(基於靜電耦合原理、光電原理或電磁感應原理)。大鍵盤的優點是直觀易學,缺點是鍵數過多,尋找鍵位困難,而且裝置複雜,造價較高。
中鍵盤是根據漢字的拼形特點設計的。把漢字分解為字根、部首等純形符號,按一定順序組成字根序列。漢字字根在250~350個左右,經歸類合併,最後形成40~100個字根的字根表,一個字根設定一鍵與之對應,按若干個鍵輸入一個漢字。
小鍵盤的編碼方案很多,有的按字音編碼,有的按字形編碼,有的兼用字音和字形。常用的編碼方案有:漢語拼音,見字識碼,聲韻部形碼,五筆字形碼,漢字字元碼,漢字拼形碼,三角編碼,四角號碼,電報號碼,範例檢字法等。對編碼方案的考慮原則是:適應使用者的習慣,易學,易記,編碼容易,編碼的長度小,重位元速率低。
除了用按鍵方式向計算機輸入漢字以外,還有兩種藉助計算機功能的自動輸入漢字方式,即漢字自動識別(影象識別輸入)和漢語語音識別(聲音識別輸入)。影象識別輸入採用影象輸入裝置,將記錄在載體(例如紙張)上的漢字當作影象讀入計算機,通過一些預處理,將其數字化,去除噪聲干擾,並整形成規範化的形式,然後通過特徵抽取,獲得一組可區別文字的特徵。最後由識別系統將這些特徵與先驗知識庫中已知文字特徵進行一系列比較、判斷和分析,得出判別結果,即內部碼錶示的漢字。聲音識別輸入與影象識別輸入大致相似。由聲音輸入裝置將聲波程式碼讀入計算機,經過類似的處理分析後得出識別結果。這兩種輸入方式都已有一些初步的試驗結果,但尚須進一步深入研究。
漢字輸出系統
將漢字的內部編碼經轉換通過輸出裝置以漢字影象形式輸出。漢字是大字符集,很難採用整字模式印刷裝置來輸出字元形狀,因此需要採用影象資訊輸出,即點陣掃描式輸出。相應的漢字字形點陣被送入緩衝區,再通過輸出裝置將緩衝區內容輸出。現代大多數漢字輸出系統都是採用這種原理對西文輸出系統加以改造,以圖為字來完成漢字輸出的。字形表示的設計往往取決於原來西文輸出系統的輸出緩衝區設定。一般來說,漢字字形點陣設計成西文字元點陣的2×2倍大小。
另一種方案是直接建立面向內部碼的輸出緩衝區。再建立一個面向西文、漢字字形的輸出字典或字型檔。標準的固定的小字符集可用只讀儲存器(ROM),相對穩定的大字符集可用可程式設計序只讀儲存器(EPROM),而非標準的隨機圖形字符集則用隨機存取儲存器(RAM)。
漢字化程式設計
一個計算機系統可以分為三個層次。
(1)裸機:即計算機主機和各種外圍裝置;②系統軟體:處於裸機外面,包括作業系統、編譯系統和各種服務程式;
(3)應用軟體:處於系統軟體外面。因此,一個計算機系統有三層介面。使用者和應用程式之間為使用者介面。使用者通過使用者介面操縱計算機系統,使用者介面應當是使用者容易掌握和樂於接受的。中文資訊處理系統的使用者介面應能適應中文環境,能經常用中文提示操作人員和資料錄入人員。第二個介面是系統介面,這是系統軟體提供的軟體開發環境。第三個介面是機器介面,這是計算機硬體提供的基本功能,是軟體設計的基礎。
漢字化程式設計有四項要求:
(1)允許中文註解;
(2)允許中文常量賦值;
(3)允許用中文定義變數名;
(4)定義全套中文保留字。前兩項要求,只要保證中西文資訊結構相容,就能滿足。原來西文的軟體系統均可執行。加上一個中文的編輯系統,使用者就完全可以用中文編寫程式,用中文寫註解和常量,基本上改善了程式的可讀性。對第三項要求,則需要加一個預處理系統。由於前兩項要求已使程式可讀性基本改善,所以這一要求並不特別需要。第四項要求也可通過預處理的辦法加以解決。但是這樣會破壞程式設計語言的國際化和標準化,不便於吸收外國成熟的軟體產品。
漢字資料庫系統
漢字資料庫和漢字資料庫管理系統已在部分大、中型機和一些微機上開發成功,並將關係資料庫 dBASEⅡ改造成漢字關係資料庫。漢字資料庫系統已應用在漢字文獻資料庫、事務管理、人事檔案管理、工資管理、企業管理、商業管理、通訊管理、交通運輸管理、計算機輔助教學等方面。
參考書目
張壽萱等:《中文資訊的計算機處理》,宇航出版社,北京,1984。