反應器動態特性
[拼音]:qingbao jiansuo xitong
[英文]:information retrieval systems
對情報資料進行收集、編輯、管理和檢索的系統。現代情報檢索系統是由電子計算機、通訊網路和終端裝置等組成的自動化系統,可進行情報資料的收集、標引、分析、組織、儲存、檢索和傳播等工作。計算機情報檢索可分為資料檢索、文獻檢索、圖譜檢索、事件檢索等型別。計算機情報檢索的服務方式又可分為三類:
(1)定題情報服務。它是針對相對固定的使用者提出的要求,定期對新到文件進行檢索,及時向用戶提供所需資訊。
(2)回溯情報檢索。它是根據使用者的要求,對過去某段時間內積累收藏的全部文獻,進行主題檢索,一般採用離線批處理方式。
(3)聯機情報檢索。它採用人機對話的方式,使用者在計算機終端上經過通訊線路直接與計算機對話,能在短時間內獲得檢索結果。
簡史
早期的情報檢索系統採用純手工方式,使用卡片、索引和目錄。直到現在相當一部分圖書館和情報服務中心仍沿用這種方式。40年代曾出現機械操作的檢索系統,但未推廣。50年代出現了利用穿孔卡片的計算機資料處理系統,它在情報檢索方式的革新中起過一定作用。60年代計算機情報檢索開始得到推廣。當時採用離線處理和麵向磁帶的方式,現在有些情報服務中心還沿用這種方式。這一時期還開始研究聯機檢索方式。1964年美國麻省理工學院研製成功第一個實驗性的聯機檢索系統,它不僅能用標題中的關鍵詞來檢索,還可用引文索引和書目結合的原理進行檢索。1965年美國航空航天局(NASA)開始研究第一個大規模的聯機檢索系統RECON,於1969年投入使用。它採用了美國洛克希德公司開發的DIALOG聯機檢索軟體。1971年美國國家醫學院圖書館的聯機檢索系統 MEDLINE投入使用。它採用美國系統發展公司開發的 ORBIT聯機檢索軟體。70年代衛星通訊網路TYMNET的建成對發展聯機情報檢索系統產生重大影響。TYMNET是蒂姆謝爾公司經營的分時資料通訊網路,它遍佈美國全國並延伸到加拿大和歐洲,通過這個網路連線了許多重要的文獻庫,它以租用方式為使用者提供選接遠地資料庫的檢索服務。這一時期出現的聯機文獻服務中心,實際上是文獻服務零售商。他們通過協議得到若干種文獻資料庫,連線到自己的計算機系統上,然後向用戶提供文獻檢索服務。例如,系統發展公司經營的ORBIT系統和洛克希德公司經營的DIALOG系統提供了廣泛的重要文獻資料庫的檢索服務,包括化學文摘、工程索引、國家技術情報、科學引文索引以及教育情報中心和國家農業圖書館的文獻資料庫。1977年聯機服務的使用者已達3000戶,年檢索次數超過1百萬次,累積使用機時達幾十萬小時。表中是主要聯機情報檢索系統的概況。
聯機情報檢索
聯機情報檢索系統由帶有文獻資料庫的電子計算機、通訊網路與終端組成。使用者能使用終端直接與他希望查詢的文獻資料庫交換資訊。終端一般配備電話機、鍵盤、顯示器和印表機等裝置。終端與計算機之間傳遞資訊可通過普通通訊線路或通過電話線路或通訊衛星來進行。利用通訊衛星可以把不同地區和國家的文獻資料庫連線起來,實現情報資料的共享。聯機情報檢索的關鍵技術包括文獻資料庫、聯機情報檢索軟體、文獻傳輸技術和文獻輸入輸出裝置等。
文獻資料庫
現代聯機情報檢索系統已發展到擁有數百個文獻資料庫(見表),每庫收錄文獻數目從數千篇到數百萬篇,收錄範圍包括自然科學、社會科學和人文科學,並有建立跨學科文獻資料庫和私人文獻資料庫的傾向。從內容來看,包括簡單的題錄、文獻摘要(即二次文獻),直到文獻全文(即一次文獻)。建立和應用文獻資料庫包括5個環節:
(1)收集,包括查詢合適文獻、提取有用資料和鑑定資料的有效性和正確性等三個步驟。
(2)標引,指用程式碼或某種壓縮形式標定選擇文獻資料的必要資訊。程式碼包括數字程式碼和圖形程式碼。可用數字化儀或電子掃描的方法輸入圖形,建立圖形資料庫。通過標引不僅使資訊程式碼化,而且對資料進行了壓縮。
(3)登入,是在計算機裡組織和轉換資訊的過程。一般採用隨機存取的方式。文獻資料庫由文件組成,每個文件包括名稱、內容(屬性)、建檔日期和發表時間。
(4)檢索,指用主題詞或其他記錄專案從文獻資料庫中找出需要的資料。檢索分兩個階段:先用標引所抽出的主題詞表示問題,再找出內容與問題的主題詞相符合的資料或文獻。聯機檢索使用控制語言,其特點是速度快並能對問題表示的正確性和文件能否正確回答作出一定判斷。
(5)傳播,即將資訊傳遞給使用者。把聯機檢索系統與縮微膠片系統結合起來,能將照片和文獻全文的縮微膠片傳送給使用者。圖形資料庫的檢索結果還可以通過圖形工作站傳送。
情報檢索軟體
聯機情報檢索軟體是通用性很強的模組結構軟體,它還具有檢查程式,能自動檢查和排除故障。現有應用最廣的檢索軟體是DIALOG和ORBIT。在ORBIT軟體中用“PROG”和“USER”分別表示系統向用戶傳送的資訊和使用者向系統傳送的資訊。它向用戶提供的檢索邏輯式有主題詞與布林算符的組合、前面出現過的檢索階段號與主題詞和布林算符的組合、階段號與布林算符的組合等多種靈活方式。
文獻傳輸技術
在聯機檢索系統中,終端使用者藉助於公用資料網路與系統連線。公用資料網路有三種形式:
(1)租用專線網。它能同時傳送數字資訊和模擬資訊,使用傳統的電話線路,能同時傳遞20對電話,速度為2400位/秒。
(2)數字交換網。它只能傳輸數字資訊,費用便宜。
(3)分組交換網。它也只傳輸數字資訊,把資訊分成很多小資訊包,每包約為1000位並在包前設定識別頭標和接受地址等。這種方式可以平衡線路負荷。傳輸費用與距離無關。另一種先進的傳輸技術是傳真通訊。它能把影象資訊變成數字資訊,通過電話線路傳輸。80年代出現高速傳真裝置,傳輸速度可達163000頁/小時。
文獻輸入輸出裝置
情報檢索系統採用高效能的輸入輸出裝置來解決人與計算機大量交換資訊的問題。光學字元識別器和數字掃描器是重要的輸入裝置。光學字元識別器可用於自動標引中識別各種字元。數字掃描器對整頁文稿進行高速掃描,能將模擬資訊轉換成數字資訊,並且密度很高,還能壓縮資訊。將光學字元識別與數字掃描技術結合而製成的輸入裝置,可高速輸入文獻全文以建立電子文件。高速智慧傳真影印機也可用作輸入裝置,它能將文獻和圖表變成數字資訊輸入儲存器,並具有數字掃描和傳真通訊的能力。此外,它還能將儲存器中的內容直接排版印刷。文獻輸出裝置可採用高速印表機、繪圖機和各種智慧終端。近年來研製成功的計算機輸出縮微膠片系統不僅速度快而且成本低,它將字元和影象變成縮微平片或縮微膠捲存入儲存器,然後用掃描器變成電訊號,再通過衛星傳輸到使用者終端。計算機輸出的縮微膠片是放在盒子裡儲存的。當輸入一個檢索詞後由系統中的自動檢索機器找到命中文獻所在的縮微膠片位置,然後自動將膠片檢出,在閱讀器上顯示出來。
參考書目
C.J.Van Rijsbergen,Information Retrieval 2nd ed.,Batterworths,London,1979.
F.W.Lancaster,Information Retrieval Systems: Characteristics,Testing,and Evaluation,2nd ed.,Wiley,New York,1979.