連結分析法——情報學研究新方法論文
連結分析法——情報學研究新方法論文
【內容提要】本文認為連結分析法是網路資訊計量學的重要研究方法,是情報學研究的新領域。它完善了情報學方法論體系,豐富了情報學理論,是情報學逐漸成熟的一個重要標誌。文章簡單介紹了網路資訊計量學,並對連結分析法進行了分析。
【摘要題】理論縱橫
【正文】
20世紀90年代以後,以數字化技術、多媒體技術、網路通訊技術綜合而成的現代資訊科技,引發了人類社會的第二次資訊革命,人類業已邁入知識經濟時代。新的社會環境使包括情報學在內的學科研究發展面臨著新的挑戰,我們需要新的理論和方法來加以研究和利用,情報學的傳統方法在面對新的問題時,就要進行自身的轉化。如面對浩瀚的網路資訊資源,傳統的文獻計量學方法就顯得力不從心,相應地網路資訊計量學(WebmetricsorCybermetrics)就應運而生,用新的研究方法如連結分析法來描述和組織網路資訊世界。
1 網路資訊計量學
網路資訊計量學是在網路資訊環境下迅速形成和發展起來的,作為資訊計量學的一個新的發展和重要的研究領域,它的出現使傳統的基於文獻和資訊的文獻計量學、資訊計量學面臨著新的變革。關於其定義主要有:網路計量學是一門計算機科學,是一門研究網際網路上資料相互引用的科學,是一門對網路文獻規律進行統計分析的科學,基於Web和軟體計量分析工具,集計算機技術、網路技術、計量學方法、統計學方法於一體,其應用範圍覆蓋了所有基於網路通訊技術的資訊測度。網路計量學是綜合採用文獻計量、資訊計量、統計學方法、計算機技術和網路技術對網路文獻規律進行統計分析的一門科學。網路資訊計量學是採用數學、統計學的各種定量方法,對網路資訊的組織、儲存、分佈、傳遞、相互引證和開發利用進行定量描述和統計分析,藉以揭示網路資訊的數量特徵和內在規律的一門新興學科。它主要是由網路技術、網路管理、資訊資源管理與資訊計量學等相互結合、交叉滲透而形成的一門交叉性邊緣學科。
2 連結分析法研究現狀
2.1 連結分析法的內容
連結分析法是網路資訊計量學中一個重要方法,它可以看成是文獻計量學中引文分析法在網路環境中的應用。網路超文字透過鏈可以將結點連結起來,一般使用兩種方法——索引鏈和結構鏈進行連結,它既可以表示資訊之間的關係,又是構成網路的手段。在將網路相關資訊資源內容連結起來形成新的資訊鏈或資訊集合的基礎上,融合了參考文獻連結功能,並透過引文關係來分析連結網路資訊資源的方法。可以按照引用程度和引用權威資訊源來分析,在網路資訊組織、檢索、評價、服務等方面起著重要作用。
2.1.1 連結分析法在網路資訊組織方面的作用
網路資訊資源生產者如網頁創作者使用連結分析,建立一些對訪問者有用的連結,可以連結到不同主題或相同主題質量更優秀的網頁。一般來說連結型別大致有:合作連結(被連結網站和連結網站之間存在合作關係)、友情連結(網站之間可能由於在資源或其它相關方面有關係,相當於影視術語中的友情客串)、推薦連結(被推薦網站由於質量好、人氣旺、訪問使用者多或是熱門網站等原因連結)、內容連結(被連結網站和連結網站在內容上存在著互補或相通關係等),可以起到網路導航的作用,大大方便使用者在網上衝浪。Google還透過連結分析來確定網路上的權威資訊源來進行相關的排名。Google認為網頁製作者僅建立他們認為重要的網頁的連結,連結到另外的網頁就像一本書的引文,網頁之間的這種引文關係“像是對網頁進行評論的過程”。例如,網頁的製作者們創造了幾千個Yahoo的連結,困此Yahoo被當作一個重要程度點;如果許多重要的網頁都指向Yahoo,則其重要程度會更高。這種方法的好處是網頁製作者不可能誤導網站的排序,並且擴充套件性極好——當網路增長時,產生更多的重要網頁的連結,自然更能確定該網頁是否是權威的資訊源。
2.1.2 連結分析法在網路資訊檢索方面的作用
連結分析主要應用於網路資訊檢索方面,如搜尋引擎收集資訊、檢索結果的排序等。網路資訊檢索為使用者提供海量資訊多媒體資料庫,採用超文字技術使檢索空間比傳統的資訊檢索範圍更廣泛,以結點為單位組織,以超連結的方式連結相關內容,更加符合人們的思維方式,打破了線性儲存的限制,真正實現多維檢索。Web資訊檢索系統可以利用連結資訊來最佳化對相關文獻的查詢,能夠極大地提高檢索結果的相關性。在搜尋引擎收集資訊的過程中,J.Kleinberg認為搜尋引擎的Robots直接訪問Web提取出權威頁(AuthorityPage)。但是如何提取出權威頁,這需要一個原始積累和評價過程。先給出一批起始網頁,Robot從這些源網頁開始收集,可以按照深度優先或廣度優先的演算法進行。當網頁提取回來後,採用連結分析技術(具體用遞迴演算法)來計算出權威頁。有了權威網頁,Robot在收集Web資訊時,就有針對性地、高效率地訪問Web網頁。搜尋引擎檢索結果排序方面也運用了連結分析技術,由於索引資料庫容量大,若使用者輸入一個關鍵詞,有可能會有成千上萬條記錄相匹配,搜尋引擎對如此龐大的結果如何排序,如何把最相關的幾十條記錄顯示出來?搜尋引擎按記錄號的順序提取結果集中的前幾十條記錄,再按鄰近圖(NeighborGraph)演算法對這幾十條記錄排序,最先顯示給使用者。這種檢索結果排序就是利用連結分析技術,大大減輕了搜尋引擎的負擔,Yahoo、Google等搜尋引擎就採用了超連結分析技術來對檢索結果排序。2.1.3 連結分析法在網路資訊資源評價方面的作用
傳統的引文分析法在學術方面衡量學術期刊重要性的指標之一是“影響因子”(IF),哪家期刊和論文被引用次數多,影響因子就高,誰就被認為是權威,論文也就是優秀論文。在網際網路上IF對應於統計指向某一網頁的連結數目後對該網頁作出的排序,網站引用分析對應的是某個站點網頁被其它站點引用的情況的統計分析,也就是網頁可能被其它網站搜尋提問命中的結果數的多少,採用計分法和線性代數方法對中心網頁和權威網頁分數進行迭代求和,以確定權威網頁和中心網頁。這與百度搜索引擎的創始人李彥宏1996年提出的搜尋引擎的第二定律:“人氣質量定律”相一致。根據這一定律,用連結分析法進行統計網站被連結和訪問次數,可以作為評價網站和網路資訊資源質量的一個指標。再加上相應的連結文字分析,就可以用在搜尋結果的排序上了,對搜尋結果進行的按相關性排序,不完全依賴於詞頻統計,而是更多地依賴於超鏈分析。在Internet上鍊接關係反映的是網頁在全世界範圍內、同一學科類屬的影響力,評價範圍是很廣的、甚至全球性的。目前主要利用搜索引擎工具在網路上檢索網站和網頁的連結情況,並按相關性對檢索結果進行排序,大大方便了使用者在浩
翰的資訊海洋中迅速準確地獲得有用的資訊,易於操作、實用且可以節省使用者的時間,在一定程度上可以彌補同行評議等定性方法的缺陷。
2.2 連結分析法對情報學研究方法的意義
蘇聯科學家巴甫洛夫說過:“科學是隨著研究方法所取得的成就向前的。研究方法每前進一步,隨之我們面前也就開拓了一個充滿種種新鮮事物的更遼闊的遠景。”情報學是一門新興的綜合性邊緣學科,是一個開放的綜合性知識體系,它善於吸收其它相關學科的知識和研究方法。上世紀60年代後,隨著科學的日益發展,科學研究中應用研究、實用研究和開發研究比重逐漸增大,情報學研究方法體系取得了長足進步,表現在:一是情報研究的領域、物件、內容等的擴大和深化;二是現代科學學科與方法的創立和發展。情報學研究方法體系是動態的、發展的。情報學科要想在原有的基礎上實現學科研究模式的更新
、學科結構的變革和學科體系的拓展,就必須研究和採用新的思維方式和新的`研究方法,及時反映最新的學科學術動態和最新的理論學說,移植、借鑑其它學科的研究方法,如哲學方法、數學方法、社會學方法、經濟學方法、資訊科技方法等來豐富自己的研究方法,並加以創造和大膽創新,不僅引起自身學科結構的變革和深化學科前沿的研究,而且不斷髮展新的分支學科,促使學科研究充滿時代氣息。
連結分析法大大拓展了資訊計量學在網路環境下的應用,充實了網路資訊計量學的內容,是情報學研究的新領域,完善了情報學方法論體系。它是情報學逐漸成熟的一個重要歷程碑,標誌著情報學理論方法的一個新的飛躍。
2.3 連結分析法目前存在的問題
在文獻計量學中,傳統的引文分析法只要統計參考文獻資料就可完成引文分析的任務,但是在網際網路上,連結分析法的研究物件是網路資訊資源,網路資訊資源覆蓋範圍廣、動態性強,具的資訊量巨大、不確定性、缺乏合理組織、難以預測等特點,且資訊過載(InformationOverload)和資訊汙染(InformationPollution)現象嚴重;引用與被引用關係也變得十分複雜;連結分析法的適用範圍也是有限的;Internet是在一個商業化的環境中發展起來的,一個網站的被連結數量還與它的商業推廣有著密切的聯絡,因此這種評價體制在某種程度上缺乏客觀性。因此,在使用連結分析法時要充分考慮以上問題,盡大可能保證其結果的可靠性。
3 結束語
由於連結分析法借鑑了引文分析法的方法和思路,是情報學研究方法在網路環境下新應用,目前連結分析法主要實驗工具是搜尋引擎,但隨著網路資訊科技如人工智慧、網路資訊檢索、計算機網路、知識挖掘、自然語言處理等的發展,必將為連結分析法的研究和開發應用提供更為有力的支援。情報學也必將充分利用網路資訊科技,吸收其它學科的先進方法來深化、完善自己的方法論體系,建立起更為完善的體系結構,從而改變情報學學科的面貌。
【參考文獻】
1 徐久齡等.網路計量學的研究.情報學進展1998-1999年度評論,第三卷.北京:航空工業出版社,1999:78-105
2 夏旭等.網路計量學研究:現狀、問題與發展.圖書館論壇,2001,(12):44-47
3 鄒志仁.論情報研究方法體系.江蘇圖書館學報,1990,(2):18-23
4 楊濤.連結分析法存在的問題及改進方法.圖書情報知識,2002,(3):62-63
5 劉雁書,方平.Web網站站外連結型別與特徵調查-連結分析法可行性研究.大學圖書館學報,2001,(5):65-68
6 鄒菲.試論網路資訊計量學在數字圖書館中的應用.圖書情報知識,2001,(1):16-17,20
7 邱均平.資訊計量學(一).情報理論與實踐,2000,(1)
8 鄒曼莉.國外網路資訊檢索的最新進展.圖書館雜誌,2002,(2):67-70
9 J.Kleinberg.AuthoritativeSourcesinaHyperlinkedEnvironment.Proc.NinthACM-SIAMSymp.DiscreteAlgorithm,ACMPress.NewYork.1998