試論文字內容資訊過濾系統的開發與研究

  摘 要:隨著時代的不斷前進和發展,資訊科技也得到了一定的進步和創新,在各個行業中都得到了極為廣泛的應用。本文主要是在PHP的基礎上對文字內容資訊過濾系統進行設計以及開發的,其相關的功能主要包括非法資訊的過濾、後臺管理、自動安裝以及遠端頁面的檢測等。文字內容資訊過濾系統為管理員在稽核一些相關的資訊內容時提供了方面,促使其管理效率以及速度的提高。

  關鍵詞:文字內容;資訊過濾系統;開發;研究

  隨著網路資訊科技的發展以及廣泛應用,一些不法分子也開始使用網路對不法資訊進行傳送,網路上出現一些反動、色情以及暴力等相關的不良資訊傳播的情況,對社會的發展進步造成了嚴重的影響,因此,網路資訊的安全得到了越來越多的人的關注。在這個社會大背景下,對文字內容資訊過濾系統進行研究和開發,可以對網路文字中的不良資訊在傳播的時候進行過濾,促使這樣的情況得到控制,從而使人們在對網路進行使用的時候,資訊資源環境的健康整潔得到保障。

  一、文字內容資訊過濾系統的功能需求

  在對文字內容資訊過濾系統進行實際使用的時候,會對公眾資訊公開申請、網站留言以及網站資訊釋出等內容的模組了進行自動過濾,將其中出現的誹謗、侮辱以及謾罵等相關的非法內容進行自動過濾,並在系統中對相關的使用者進行提醒,將其及時反饋給管理員。這樣的工作在開展的時候,稽核效率以及速度得到了大幅度的提升。而在使用PHP進行開發設計的文字內容資訊過濾系統在使用的時候,可以對文字中的不良資訊進行剔除,還可以對一些已經發表過的文字進行檢測工作的開展,在結果出來後對相關的管理員進行及時反饋。

  一對資料庫的設計。在對MySQL資料庫進行使用的時候,其相關的設計結果相對較為清晰,在對使用者表、日誌表以及詞彙表進行管理工作的開展提供一定的便利,並且,可以對詞庫表中所含有的敏感詞、敏感詞名以及詞類別進行檢測。而在對使用者表進行管理的時候,主要包括對使用者密碼、使用者名稱以及使用者類別資訊的管理。另外,在日誌表中,則注意是對URL地址、檢測結果以及原文章內容等相關的進行管理。

  二系統中中文的簡體以及繁體互換功能。在MySQL資料庫中,其相關的字元設集被設定成了GBK格式,其檢測的敏感詞幾乎是簡體。而在現實生活中,一些使用者在對文章進行發表的時候,在文章之中總會有繁體的敏感詞存在,因此,在對使用者所發表的一些文章進行文字內容的檢測時,可以對資訊進行過濾,在這個過程中,需要對敏感詞進行簡繁的轉換,促使資訊在過濾時的準確性得到一定的提高。

  三系統中拼音以及中文之間互換的功能。在對文字內容資訊過濾系統進行運用的時候,一些文章在發表的時候,用拼音來代替敏感詞,因此,相關的工作人員還要注意在系統中設計中文以及拼音的互換功能。這樣就可以對文章中所含有的不良敏感詞資訊進行有效的過濾,從而使文字內容資訊過濾系統子在使用的時候,精確性能夠達到新的高度。

  二、文字內容資訊過濾系統的設計

  在對文字內容資訊過濾系統進行設計的時候,其主要包含有資訊過濾模組、自動安裝模組、後臺管理模組以及頁面檢測模組等四大模組。其中,資訊過濾模作為系統中的是核心內容,可以分析文字中所含有的敏感詞,對其中存在的一些非法詞彙進行最大程度的過濾;自動安裝模組可以配置系統,比如在資料庫與相關資訊進行連線的時候,需要對系統相關的管理員進行創設,從而使配置檔案得以生成;後臺管理模組在實際使用的過程中,可以在管理員管理工作實際開展的時候,為管理員進行提供許可權管理、管理敏感詞彙庫以及使用者管理等相關的操作後臺;頁面檢測模組在使用的時候可以對URL地址進行檢測,可以對網頁的原始碼進行提取,對文字中所含有的一些不良資訊進行分析以及濾除。

  一對後臺的管理設計。在對文字內容資訊過濾系統進行實際使用的時候,可以為相關的管理員提供一個相對較為簡潔、友好以及功能完善的管理後臺,以供管理員對使用者進行管理工作的開展,其中注意包括對詞庫中資料進行查旬、增加、許可權管理、刪除以及修改等操作。

  二對系統中資訊過濾模組的設計。在對文字內容資訊過濾系統中的資訊過濾模組進行設計的時候,要對中文和拼音之間的互相轉化、繁體和簡體之間的互相轉化以及喜好詞的生成等相關的功能進行重點關注。為使用者在使用過程中非法資訊的濾除、對相關使用者的搜尋的關鍵詞進行自動分析以及對使用者的喜好詞進行智慧生成等,為使用者在實際使用的過程中提供方便。

  三在系統中對自動安裝設計模組進行新增。在對文字內容資訊過濾系統進行設計的時候,自動安裝模組可以對其開展全新的安裝工作,其中主要分為三個步驟。第一是對系統資訊的填寫和配置,促使配置檔案的生成;第二是對系統相關的管理員的建立;第三是對文本系統相關的資料庫進行建立,其中還包括對系統中敏感詞庫的建立。

  三、結束語

  綜上所述我們可以得知,隨著我國經濟水平的不斷髮展和提高,我國科技水平也得到了相應的創新和進步,其中,網路資訊科技在各個行業中得到了相對較為廣泛的應用。本文通過對文字內容資訊過濾系統的設計以及研究進行全面的瞭解和掌握,其在設計的時候對關鍵詞匹配技術進行了採用,促使系統在對敏感詞進行深入分析,從而使文字內容資訊過濾系統對不良資訊內容過濾時的精準度進行提高。