數字圖書館中個性化資訊檢索研究

摘要:本文通過將智慧技術應用於數字圖書館資訊檢索系統,並結合Agent的特點和優勢,提出了一個基於Agent技術的個性化資訊檢索模式,提高數字圖書館的個性化資訊服務水平,提高資訊檢準率,實現面向使用者興趣的資訊搜尋。 
  關鍵詞:數字圖書館 Agent 個性化資訊服務 
   
  在網路技術迅速發展的今天,人們已經從資訊匱乏時代進入到資訊爆炸的時代,但是人們在認知過程中所面臨的供求矛盾並沒有由此而得到解決。數字圖書館的個性化資訊檢索技術為解決這一矛盾提供了可行性。 
   
  1、個性化資訊檢索的Agent技術 
   
  1.1 Agent的概念 
  Agent是在分散式系統中持續自主發揮作用的並且能以主動互動服務的方式完成一系列操作的計算實體,是一種基於分散式系統技術的設計模式。 
  1.2 Agent的基本結構 
  Agent基本結構分為三部分既資訊處理系統、引擎模組、內部狀態集。 
  ***1***資訊處理系統是Agent的行為控制系統。Agent的活性正是表現在它的事件處理系統上。在該結構中,資訊是與Agent有關的特定狀態。資訊處理系統涉及三個環節的活動即資訊的感應、資訊的適配、資訊的處理。資訊的感應,Agent在資訊感應環節中時刻捕捉其所關注的資訊狀態的出現。並根據其活動型別啟動相應的資訊介面卡工作。資訊的適配,資訊的適配主要是Agent通過介面卡獲取相關事件資訊作識別。在Agent的基本結構中介面卡作為外界與Agent交流資訊的介面來使用。資訊的處理,Agent通過資訊的感應和適配表明了當前資訊檢索事件的表徵狀態,而資訊的處理這一環節正是通過對資訊檢索事件的表徵狀態的處理使Agent智慧化的不斷髮生變化。 
  ***2***引擎模組是Agent的核心。Agent的引擎種類主要有以下三種觸發引擎、反射引擎、執行引擎。觸發引擎,當出現某些事件時,觸發引擎就操縱事件的規則,執行復雜的推理以決定事件的反映。比如說一個傳遞給A的伺服器請求導致訊息事件的發生。A的***訊息***事件感知將及時檢測該事件的發生’從而引發A的***訊息***事件適配接收此訊息。反射引擎,其作用是檢測事件並且反映出Agent現有的狀態。執行引擎,資訊檢索事件發生時能夠使用虛擬機器系統呼叫Java或者呼叫指令碼語言解釋系統。總的來看,引擎模組主要負責處理人機之間檢索資訊的互動,具有互動與協調功能。 
  ***3***內部狀態集是表現Agent當前狀態的成分,它包括感知器、適配資訊、資料庫資訊。感知器,感知器時刻感應檢索資訊的出現。適配資訊,從感知器接受資訊,並且對其做出反映並提供與其它資訊資源做出連線。比如使用者介面資訊、連線指引資訊等。資料庫資訊,為了方便資訊的查詢及共享使資訊以某種標準格式儲存在庫裡。 
   
  2、Agent的個性化資訊檢索結構體系 
   
  2.1 現有的個性化資訊檢索結構體系的缺陷 
  ***1***較少的考慮使用者的差異,適應使用者興趣變化能力差 
  ***2***綜合利用個性化資訊檢索優勢性差 
  ***3***使用者與檢索系統互動方式比較單一 
  ***4]檢索精度和效率低 
  ***5***動態監測能力差
  2.2 Agent個性化資訊檢索的結構體系總體建設思路 
  通過對現有的個性化檢索結構體系缺陷的分析,我們提出了基於Agent的個性化資訊檢索結構體系。 
  3.Agent的個性化資訊檢索 
  根據以上對基於Agent個性化資訊檢索結構體系的思路分析,筆者提出了以下新的基於Agen價性化資訊檢索模型 
  3.1 針對現有的個性化資訊檢索模型的缺陷進行了如下的改進: 
  ***1***進一步的考慮到使用者的差異並採取迴圈反饋的措施使的系統給出結果能夠自適應於使用者查詢興趣的變化。並在使用者介面和使用者資料庫連線環節除了採用相關問題反饋和聚類處理還採用了更新建立使用者檔案的措施,進一步提高了查詢效率。 
  ***2***採用了基於內容和查詢協作的雙向混合過濾,使的查詢結果更加準確。 
  3.2 工作流程描述如下: 
  ***1***使用者描述興趣和提出檢索請求,在使用者介面部分使用者Agent接受該請求,呼叫使用者資訊資料庫中的使用者個性化資訊,通過推理產生精化的個性化檢索模式。 
  ***2***啟動資訊檢索模組,呼叫元搜尋引擎去檢索與使用者興趣最為相關的資訊,同時通過情景關注Agent對資訊動態變化予以關注。並且進一步通過基於多Agent協同合作的檢索器進行提取和分解有用資訊。 
  ***3***結合搜尋引擎排程機制及使用者個性化資訊推送Agent,根據查詢請求及對使用者需求分析,進行搜尋,並將資訊搜尋Agent蒐集來的資訊裝入資料庫,自動分類,搜尋工作是時時進行的。 
  ***4***系統將使用者需要的資訊通過個性化資訊推送Agent、資訊過濾Agent、資訊挖掘Agent等多個Agent間的協作處理後提供給使用者,還可以向用戶推薦最新的和其他興趣相似的使用者感興趣的資訊,同時更新通用興趣主題庫。 
  ***5***通過相關問題反饋和聚類處理模組,將使用者評價記錄到相應的知識庫中。同時更新使用者興趣檔案。 
  ***6***收集從各個選中的搜尋引擎所返回的結果,消除無效的連結頁面,去除重複、多餘的資訊,按照相關性進行排序。 
  ***7***根據使用者要求,把這些資訊依照相關性從高到低的順序按照統一的格式返回給使用者。 
  ***8***使用者通過瀏覽返回的結果確認是否為感興趣的資訊,並將反饋結果交給使用者資訊資料庫進行聚類,精化使用者資訊資料庫資訊。 
   
  4、結 語 
   
  數字圖書館個性化資訊檢索是對數字圖書館實現“以使用者為中心”的資訊服務模式的有益嘗試。數字圖書館的個性化資訊檢索的實現是一項十分複雜的工作。他依賴與很多技術的發展。目前雖然取得了一些進展但尚存在需要完善和改進的地方。因此,我們應該將更多科研成果應用與其中,加強對模型的研發,以推出效率更高的檢索模型。