李斯·戴維斯,T.W.
[拼音]:qingbao jiansuo ruanjian
[英文]:information retrieval package
為完成情報檢索系統的功能而設計,並在特定計算機作業系統支援下工作的計算機應用程式。作為軟體系統,情報檢索軟體由作業系統、資料庫管理系統、聯機控制系統、語言介面和應用程式5大部分組成,但通常所稱的情報檢索軟體大都指應用程式或兼含的資料庫管理和聯機控制功能。
要求
情報檢索系統是按照不同領域和不同用途研製和使用的,因而情報檢索軟體的設計和功能也隨之而異。例如,下列因素都可能向情報檢索軟體提出不同的要求:
(1)系統處理的情報是文字型、數值型或影象型,文字型情報又有不同語言之分;
(2)系統處理方式是聯機的還是批式的;
(3)系統服務範圍是對外公開還是內部利用;
(4)系統儲存的情報容量是大還是小;
(5)系統採用的計算機是大型機、小型機還是微型機;
(6)系統所要求的實時性如何;
(7)系統提供使用者的介面功能如何等等。
綜合上述因素,使用者需求、情報處理加工的複雜性和採用的計算機效能,是設計不同型別情報檢索軟體的主要依據。不同的情報檢索系統,就有不同的情報檢索軟體, 例如有文獻情報檢索軟體、 聯機情報檢索軟體、微機情報檢索軟體、工程情報檢索軟體、科學資料情報檢索軟體、商業情報檢索軟體等。 但是, 各種情報檢索系統的基本功能不外乎為儲存、檢索和利用幾個部分,作為其應用程式,也具有共同和共性的功能。以聯機文獻檢索應用程式為例, 首先, 文獻情報的主要特點是:主要採用自然語言;資訊長度大都為可變長;資訊項為不特定多數項;資訊結構主要採用線性結構和樹型結構,不需要網型結構之類的複雜結構;資訊量不斷累積,因此儲存量龐大;使用者提問比較複雜,需要多元次邏輯式展開處理;由於採用自然語言,為了減少誤檢率和漏檢率,需要採用展示標準詞、同義詞、 上位詞、 下位詞、相關詞、 同音異義詞的主題詞表; 由於資訊長度可變,需要採用對可變長資訊加以比較的技術 (前方一致、後方一致、任意位長一致、指定位一致)等等。
組成
根據上述特點,聯機文獻檢索應用程式通常由下列程式模組組成:
(1)
儲存模組
包括將文獻資訊儲存到計算機可讀儲存介質的各種實用程式,如資料結構和文獻正文定義、資料錄入、查錯糾錯、程式碼和格式轉換、載體轉儲、資料壓縮等。
(2)
資料庫建立和維護模組
包括將上述已儲存的資訊加工處理為資料庫或檔案形式、直接為各檢索和服務模組的過程和指令呼叫的各種實用程式,如記錄的排序合併、索引(倒排)檔案和文獻檔案的建立、更新和維護等。
(3)
檢索和服務模組
是情報檢索軟體體現功能差異和對使用者友好程度的核心部分,通常採用對話方式接受使用者提問。因此這一模組包括系統處理和分析檢索指令和使用者提問的一系列過程和檢索指令,使用者正是通過這些指令與系統對話,進行檢索和與檢索有關的操作,列印輸出檢索結果,保留檢索策略,系統諮詢服務,與主題詞表對話等。
(4)
主題詞表模組
可用於編制主題詞表,本身是一個獨立的應用程式,同時可與檢索模組和資料庫配合,起到自然語言(檢索者所用語言)、文獻出現語言和系統控制語言之間相互介面的橋樑作用。作為獨立的應用程式,包括詞表編制(輸入、 邏輯查錯、參照關係生成、索引生成、編輯出版、維護統計等) 和檢索介面兩大部分的各種實用程式。
(5)
安全和記帳模組
用於保護系統的各種資源和功能不讓非法使用者利用,並對系統的資源和功能的利用情況進行統計,還包括使用者使用資料庫、聯機、列印輸出等涉及收費有關的記帳實用程式等。
(6)
管理和支援模組
專為系統管理員提供各種實用程式,視各情報檢索系統不同,有的情報檢索軟體把磁帶格式轉換程式、裝庫程式、更新程式、使用者管理程式、主題詞表建立和管理程式、排版印刷程式、定題檢索服務(SDI)程式等,都收集在這一模組內。
指標
衡量一個情報檢索軟體的綜合指標可包括:空間儲存效率、響應速度、檢索效率、檢索指令的功能和易用性、保密安全性、管理和支援服務的各種實用程式的齊全性等等。
舉例
國外計算機廠商大多同時提供通用的情報檢索軟體。下表為為中國引進的計算機提供的情報檢索軟體。
國外商業化情報檢索系統通常自己開發適合自己需要的、高效率情報檢索軟體。例如美國的DIALOG、ORBIT,歐洲航天局情報檢索系統的 IRS-QUEST、日本科技情報中心的 JOIS-Ⅱ等,都是自己開發的情報檢索軟體。中國已開發並投入實用的聯機情報檢索軟體有北京文獻服務處(BDS)的BDSIRS 情報檢索軟體,機電工業部機械工業情報研究所的MINISIS 漢化情報檢索系統,中國科學技術情報研究所的漢化CDS/ISIS聯機檢索軟體等。