感知型社會資訊網路論文

感知型社會資訊網路論文

  1資料精準感知型社會資訊網路不完備多社會關係填補方法研究

  在社會資訊網路中,許多節點之間的關係是未知的,從資料精準感知的角度來講,有必要對未知的、不完備的社會關係進行補全。社會資訊網路不完備社會關係填補,實際上是一種基於給定的圖以及已知邊來預測未知邊的問題。進一步講,它可以轉化為傳統的機器學習問題——矩陣補全(MatrixCompletion)。最常見的矩陣補全方法是矩陣分解。矩陣分解在矩陣缺失值較少的情況下非常有效,其重構矩陣能保留原始矩陣大部分資訊,然而真實的社會資訊網路往往是一個稀疏矩陣,僅僅擬合少量值來分解大規模稀疏矩陣,容易引起“過擬合”問題,進而影響模型的泛化能力,對未知元素的預測能力減弱[2]。因此,我們需要另闢蹊徑,尋求大型稀疏矩陣填補新方法。為了消除稀疏矩陣結構約束,實現對任意型別關係矩陣進行填補,我們研究的重點是利用多源網路知識的協同共享,發現相似知識間的潛在關聯,構建潛在關係矩陣,提高大型稀疏矩陣填補的效能。

  2動態核協同社會資訊網路群體關係融合方法研究

  基於核協同挖掘的極大相似子關係具有動態性及連續性,從聚類的角度來講,處理動態資料目前主要有兩種手段。一種忽略了資料隨時間的變化,在隨時間累積的整體資料上直接應用傳統聚類方法。但是,在社會網路演變過程中,突發事件的產生使得每一網路快照上的聚類是明顯的,因此整體聚類結果可能是毫無意義的。另一種則忽略了不同時刻資料之間的關聯性而在每一個網路快照上單獨應用傳統聚類方法,這導致了不同時刻的聚類結果相差甚遠。針對研究需要,我們的目標是設計具有普適性的線上式動態群體關係融合演算法,以聚類結果精準為前提,實現時變條件下聚類結果仍然能夠保持光滑性。

  3多維協同感知型社會資訊網路演化分析

  這部分的研究可以概括為演化特徵分析、共棲屬性提取、協同演化分析三個層面。

  具體地說:

  1)基於TimeLine的感知型社會資訊網路演化特徵研究。基於TimeLine的感知型社會資訊網路演化特徵研究的主要內容是對其時序特徵進行分析。因為社會資訊網路中存在著多變性、瞬時性、Churn特性,因而從已有社會感知資料中獲取TimeLine的準確程度將直接影響時序特徵的分析結果。抽取TimeLine的時序間隔過大、過小或過於平緩,都不能準確的反映出該時間區間所發生事件的明顯特徵[3]。如圖1所示,TimeLine上有五個時序區間T1、T2、T3、T4、T5,其中T1與T2、T2與T3之間存在著相對的變化特徵,T1與T5之間屬於絕對變化特徵。因此,如何透過已有的社會感知資料,提取理想狀態下的TimeLine,並透過演化分析演算法,對TimeLine上的不同時序進行演化特徵分析是本研究的研究重點之一。

  (2)感知型社會資訊網協同共棲屬性提取。該研究將透過對感知型社會資訊網協同共棲屬性提取,對其演化屬性進行分析。目前的研究,大多以靜態或時序網路快照為主。因此在實現連續動態的演化環境中,需要重新定義協同演化度量指標。其中,共棲屬性可以區分出社會資訊網路中感知物件之間是共生關係,還是競爭關係等。設計個體和群體的共棲屬性提取方法,總結屬性變化規律,是分析社會資訊網路協同演化關係的重要前提和基礎。

  (3)動態巢狀多向關聯的協同演化關係分析。該研究將設計感知型社會資訊網路的自適應表示式,提出協同演化關係分析方法,對多維協同演化關係進行分析。社會資訊包括了各種維度的資訊,資訊之間起著協同作用,構成了整個社會資訊網路的執行過程。它的協同演化過程是一個跨界現象,不僅發生在一個層級中,還可能發生在其他較低或較高層級中,而且還會發生在層級之間;既包括內部微觀物件的協同演化,也包括與外部環境的宏觀協同演化,並且這些不同層次的演化是互動巢狀、難以區分的。微觀行為主體的活動經常會產生宏觀上的效果,宏觀層的演化也會對微觀層的演化產生影響[4]。層級間互動的演化,是多層級協同演化的重要特徵。圖2展示了一個社會資訊網路中多維資訊的協同。這部分還將利用各個子網路的屬性值,重點研究透過社會資料感知計算技術,對動態巢狀多向關聯的協同演化關係進行分析,提出對社會資訊網路中的單方主導演化關係、共同主導演化關係和無主導演化關係的協同演化關係分析方法。

  4動態社會資訊網路建模(Dynamicsocialnetworkinformationmodeling)

  建立動態社會資訊網路模型,首先需要確定描述網路模型的時間片特徵值,即對時間軸進行足夠細的分割,使得每一時間片上至多有一個節點變更其連線策略,而同時保證其他節點保持其原有連線狀態不變。其次,需要設計網路模型的動態連線策略。連線策略的正確選擇,決定著最終模型成功的與否。按照以上思路,模型建立部分的研究內容分為以下三個方面:(1)以節點社會上下文(SocialContext)為效用值,消除網路噪音。研究表明,人的行為活動具有重複性與週期性,這樣就可以將人的多種行為特徵表示為網路節點的不同社會屬性,將節點的社會屬性進行歸納就可以得到節點的社會上下文知識[5]。根據社會上下文,可以得到節點的信譽評價值。

  真實的社會資訊網路中會存在一些由惡意節點引起的一定機率的誤連線,因此在建模之前預處理網路資料可以降低由於個體行為的不確定性所帶來的網路演化噪音。本部分內容研究應用社會上下文來評價節點的信譽度,並透過累計信譽記錄得到節點的最終信譽值。由於惡意節點在社會資訊網路中會惡意破壞社會資訊網路中的正常連線,對網路研究的負面影響較大,所以可以根據節點的信譽評價值,孤立惡意節點並刪減其連線。(2)基於社會特徵的時間片發現演算法:Timesectiondiscoverapproachbasedonsocialinformation(TSI)。根據資訊網路中節點的社會學特性,引入社會資訊網路中節點的社會資訊屬性。因為當某個節點社會資訊值發生一定變化時可能會引起社會資訊網路結構的變化,所以時間片的劃分應以節點社會資訊屬性的較大變化為劃分依據,細化時間軸,使得每個時間片內只有一個節點的社會資訊值發生變化,而其他節點按照慣性保持其社會資訊屬性值不變。

  經過這樣處理之後,網路結構的變化過程就可以看成是一個馬爾可夫過程。(3)基於半隨機遊走策略的動態連線。社會資訊網路中節點的連線過程可以看成是節點對社會資訊進行追逐的過程。當網路中某些節點的社會資訊值發生較大變化時,網路中的結構一般會發生相應的變化,其變化表現為網路中的某些節點會相應地連線到目前社會資訊價值較大的節點上。這部分將研究在建模中應用隨機遊走策略,並設定連線閾值α。遊走從網路的某一節點開始執行,當遊走到目前社會資訊值較大的節點時進行連線,之後繼續遊走到下一個目標節點,直到多次搜尋並無更大社會資訊值節點,完成一次隨機遊走。在每個時間片中模型要完成多次隨機遊走的動態重鏈。在隨機遊走的過程中由於應用了連線閾值α限定連線操作,所以此操作可以看作是半隨機連線,連線閾值α的設定與網路中節點的社會資訊價值有關,α的具體值應高於網路中節點的社會資訊價值的平均值,並可設定α的浮動範圍δ(δ是一個較小的值)。由於社會資訊網路研究的資料精準感知型核協同社會資訊網路的網路結構是動態演化的'結果,所以網路結構將隨著網路中節點數量、節點的社會資訊屬性及節點社會上下文的變化而發生相應變化。上述三個方面的研究可以綜合表述為動態半隨機重連策略,應用這種策略建立的網路模型可以表現出網路由不穩定到相對穩定,再到不穩定的演變過程。

  5社會資訊網路上突發檢測方法(Socialnetworkinformationburstdetectionmethod)

  由於社會資訊網路同時具有資訊網路的實時性和社會網路的互動性的特點,因此可以透過研究社會資訊網路拓撲結構的演化行為,研究突發事件的檢測與預警方法。主要研究問題如下:(1)網路節點影響力分析方法。針對社會資訊網路不同於傳統網路的集聚特性,提出網路節點的影響力分析方法。首先,基於拓撲勢理論對社會資訊網路進行社群發現,並對網路中的節點進行分類;其次,針對不同型別節點的不同結構特徵,分別對其進行影響力分析。(2)網路節點的可信度評估方法。研究社會資訊網路中節點的可信度,一方面採用雲模型對社群內和社群間的節點進行全域性信任評估,另一方面透過引入時間窗及構造時間函式實現對可信度的動態更新。(3)突發檢測方法與預警方法。由於突發事件具有的海量資料積聚、爆發的瞬時性及偶然性等特點,因此首先引入滑動視窗的思想對監測到的資料流進行分析,然後分析網路拓撲的演化行為,進而對網路上的突發事件進行檢測和預警。在這些需要解決的科學問題中,基於網路拓撲演化的突發事件檢測與預警方法研究為社會資訊網路研究目標實現的最後一環,而且帶有更大的探索性和前瞻性,所以基於網路拓撲演化的突發事件檢測與預警方法研究可是說是我們需要解決的關鍵科學問題。

  6結論(Conclusion)

  社會資訊網路是兼具社會網路和資訊網路特徵的新型網路,一方面其節點間表現出強互動特徵,另一方面其拓撲結構呈現強時變特徵。由於社會資訊網路的資料具有多源性、異構性,拓撲結構具有多變性、瞬時性、Churn特性以及不同層級之間存在著互動巢狀演化等現象,因此社會資訊網路是一個異常複雜的系統,社會網路和資訊網路上的傳統研究方法很難直接應用或遷移到社會資訊網路上。目前來看,社會資訊網路上的理論研究還比較匱乏,開發、應用等活動尚缺乏合適的實踐方法和指導理論。真正建立一個面向資料精準感知的動態社會資訊網路研究平臺,還需要我們不斷努力。

最近訪問