航天遙測

[拼音]:jisuanji xinxi jiansuo

[英文]:computer information retrieval

利用計算機系統有效儲存和快速查詢的能力發展起來的一種計算機應用技術。它與資訊的構造、分析、組織、儲存和傳播有關。計算機資訊檢索系統是資訊檢索所用的硬體資源、系統軟體和檢索軟體的總合。它能儲存大量的資訊,並對資訊條目(有特定邏輯含義的基本資訊單位)進行分類、編目或編制索引。它可以根據使用者要求從已儲存的資訊集合中抽取出特定的資訊,並提供插入、修改和刪除某些資訊的能力。計算機資訊檢索系統可分為:一次性資訊檢索系統和二次性資訊檢索系統。前者適合於單個條目,即資訊量不大而需要經常修改的情況,如航空公司訂票系統。後者適合於資訊條目本身資訊量較大而不常修改的情況,如圖書或文獻檢索系統。

資訊分析

目的是確定輸入系統的資訊條目的格式和內容,併為建立索引作準備。一次資訊檢索系統用於確定邏輯記錄的格式和記錄關鍵字,或記錄之間的關係;二次資訊檢索系統用於濃縮原始資訊,又稱作標引。這相當於編制題錄或文摘,即找出標識原始資訊的一組關鍵詞(稱作主題詞或檢索詞),從而產生一部檢索詞典。在詞典中還可以規定同義詞、近義詞關係和各詞語之間的層次關係。標引工作的一部分可由計算機自動完成。例如,利用題內關鍵詞索引或頻率統計法等技術從原始資訊中抽取出關鍵詞。

資訊儲存

目的是建立資訊庫,以備檢索。為便於查詢,需要合理組織資訊條目,可以按檔案形式組織,也可以按資料庫形式組織。資訊檢索系統常用的檔案組織形式有:順序檔案、索引順序檔案、倒排檔案和聚類檔案,其中用得較多的是倒排檔案和聚類檔案。

倒排檔案對每個資訊條目給出一個表示主要屬性的唯一的關鍵詞,稱主關鍵詞。所有主關鍵詞和相應資訊條目在檔案中的地址構成一個索引,稱為主索引。系統還給出允許使用者檢索的資訊條目中的次要屬性,稱為次關鍵詞。次關鍵詞不是唯一的。通過在每個次關鍵詞後面列出出現該屬性的資訊條目的主關鍵詞而構成另一種形式的索引,稱為次索引。從主關鍵詞查主索引可以找到資訊條目。從次關鍵詞查次索引可以找到若干主關鍵詞,系統從主索引可以找出若干有關的資訊條目。在一次檢索提問中要查詢的索引部分是很小的,所以倒排檔案結構的查詢時間較短。

聚類檔案是通過分析資訊條目之間的相似性來組織的。檢索時,系統查找出與提問關鍵詞有相似性的聚集類,聚類檔案結構特別適合於文獻檢索的情況。

資訊檢索

有離線處理和聯機檢索兩種檢索方式。對於前者,使用者提交書面檢索要求,操作員按期打印出結果交付使用者。對於後者,使用者通過聯機終端打入檢索命令,系統當時給出回答。通過計算機網路,使用者還可以進行遠端離線處理或遠端聯機檢索。

使用者與系統的介面是檢索語言,通過它提出檢索要求。檢索語言通常包括檢索命令和提問邏輯表示式兩個部分。命令傳達使用者對系統的請示,邏輯表示式則提供執行該命令時的邏輯條件。邏輯表示式是邏輯運算子(與、或、非)、邏輯關係符和不同屬性的組合。系統提供一組程式來解釋和執行檢索語言。

系統維護

系統提供一組實用程式來進行裝入資訊的格式轉換、資訊檔案的初始化和故障後系統的重新執行等一般性服務。二次資訊檢索系統還提供檢索詞典維護程式,以便能增加、刪除、修改和打印出檢索詞。

保密性和可靠性

計算機資訊檢索系統的保密性是通過對資訊條目的存取控制機構來實現的。對於以檔案系統為基礎的資訊檢索系統,存取控制一般只能在檔案一級,即通過在開啟檔案時核對口令來控制非授權的使用者檢索資訊。對於以資料庫技術為基礎的檢索系統,存取控制可以在檔案、記錄,甚至在資訊條目中某資訊項一級,既可以通過核對口令方式,也可以採取呼叫使用者編寫的編碼、譯碼子程式的方式阻止非授權的使用者呼叫保密的資訊。

計算機資訊檢索系統的可靠性與計算機系統的可靠性密切相關。它依賴於計算機系統硬體的可靠性、作業系統的故障恢復機構、資料庫管理系統的恢復機構和應用軟體採取的故障處理措施。任何計算機資訊檢索系統都不能保證資訊不受到破壞,但是它必須具有從破壞中得以恢復的能力。

效能評價

計算機資訊檢索系統的效能通常根據漏檢索、誤檢率、檢全率、檢準率和響應時間(對聯機檢索)等來衡量。關鍵詞本身錯誤或使用的查詢演算法不對會引起漏檢。關鍵詞的二義性會造成誤檢。檢全率和檢準率主要針對二次資訊檢索系統而言的。檢全率指檢出的相關資訊條目數與資訊庫中的相關條目數之比。檢準率指檢出的相關條目數與所有檢出的條目數之比。這二者是相互制約的。一般認為一個系統檢全率在60%~70%,檢準率在40%~50%即能滿足需要。響應時間的快慢不僅與軟體設計的好壞有關,而且與硬體的效能有關。

應用範圍

計算機資訊檢索最初用於圖書、文獻檢索方面,後已用在軍事、工業、醫療、航空、政府機關等各個方面。有的只作資訊檢索用,有的則是將資訊檢索技術應用在其他綜合的管理資訊系統之中,如用於輔助決策的軍事情報檢索系統;航空公司自動訂票系統,醫療情報系統(包括病歷管理、預約登記、通知、病名檢索、病床管理等);旅館床位管理系統;檢索型的輔助設計系統等。此外,政府部門或企業的檔案管理、科研或工程專案管理、基本建設投資管理等都可應用資訊檢索技術。

參考書目

張琪玉著:《情報檢索語言》,武漢大學出版社,武漢,1983。

F.W.Lancaster,Information Retrieval Systems—Characteristics,Testing,John Wiley,New York,1968.