拉斯克-許勒,E.
[拼音]:duobianliang fenxi
[英文]:multivariate analysis
多個變數統計分析技術在社會研究中的運用。又稱多元分析。它的分類方法很多,主要有按變數層次分類和按功能分類。
社會現象是複雜的,例如一種現象往往不止是一種原因引起的;或一種社會現象往往同時扮演因和果的角色;或作為因的各種現象之間又存在著某種聯絡;或在確認現象間的相關或因果聯絡時,往往還需要通過引入其他變數,才可加以確認。因此,多變數分析除根據變數層次分類外,還可根據多變數分析的目的、功能或用途來分類,便於使用者根據需要選擇不同的分析技術。在選擇時,要注意變數的層次。
詳析模式
為了深入研究和分析兩個變數x和y之間的關係,需要引進第3個變數z,然後通過3個變數的因果模型分析,詳細分析所要研究的兩個變數x和y之間的關係。其中包括辨明變數x和y之間是否確有關係,關係的方向如何,以及辨明變數 z與變數x和y之間的關係型別,是否存在中介的變數等等。例如,根據統計,婚齡長的人,患病率高些。初看起來,似乎變數婚齡與變數患病率之間存在著正相關。但如果引入變數年齡z,則發現這樣一個事實:年齡大,同時也是婚齡長和患病率高的原因。實際婚齡和患病率之間並非存在真正因果的關係。可見,為了探討婚齡和患病率之間是否確有關係,必須引入年齡z方能得出正確結論。又如,增加教育經費和提高教育質量之間存在著正相關。但教育經費 x不能直接轉化為教育質量y,其間必然還要通過中間措施,如購置教學裝置z。所以,購置教學裝置成為教學經費和教育質量形成正相關必不可少的一箇中介變數。
引入變數 z對原有變數x和y關係進行分析,是通過對變數z的控制進行的,因此變數z又稱控制變數。具體作法是,對於定類或定序變數採用“分表法”,對原有變數x和y作交叉分類表,又稱原表(表2),按控制變數z的不同取值:z=z1,z=z2,z=z3,……再作成分表(表a,表b,表c)。然後比較原表和分表中變數x和y的相關係數。對於定類變數,可通過λ係數或τ係數的比較;對於定序變數,可通過 γ係數的比較;對於定距變數,可採用偏相關係數法…,稽a href='http://www.baiven.com/baike/223/306724.html' target='_blank' >粗苯穎冉舷喙叵凳?img src="/uploads/baike/3/35679y807397_25264.jpg" alt="公式 符號">和偏相關係數
,無須再作原表和分表。這兩種方法的原理是一樣的。
為了對詳析模式有一清晰瞭解,必須搞清控制變數z在變數x和y中所處的位置。如果控制變數z位於變數x和y之前(圖1)則稱z為前置變數;如果控制變數z位於變數x和y之間(圖2)則稱z為中介變數。
根據變數z控制前後,變數x和y相關程度的變化,可對變數x和y之間的關係作如下幾種解釋。
(1)原表和各分表中,變數x和y的相關程度都不變,則可確信變數x和y之間的原關係是成立的,是存在相關的,且其相關程度和原表是一樣的。
(2)若分表中,變數x和y的相關程度和原表相比,呈現複雜的情況:有的不變或增加;有的減少或消失。這時可將變數 z看作是討論變數x和y之間關係的一種分類或條件,z又稱條件變數。
(3)若 z控制後,所有分表中變數x和y的關係都消失了,則說明變數 z可能是變數x和y變化的共因,即前置變數(圖1),但也可能是中介變數(圖2)。對於前者(圖1),嚴格說來變數x和y並不存在因果聯絡,因此變數 x和y之間的相關稱偽相關或虛假相關。即用變數z就可解釋變數x和y之間的關係。例如,前述變數年齡z就可能是變數婚齡x和變數患病率y產生虛假相關的前置變數。而購置教學裝置必然發生在增加教學經費之後和提高教育質量之前,它稱作中介變數。有了中介變數,對變數x和y之間的關係就可作進一步的分析或解釋。所謂變數x和y關係的消失,並不意味著相關係數的計算結果正好為零。對於抽樣來說,變數間相關為零的原假設被接受就可看作是關係的消失。若變數z控制後,分表中所有變數x和y的關係仍然是顯著的,但都減弱了,則說明變數x和y的關係中部分是由於z的存在。
(4)對於圖1的因果模型,詳析模式不僅可以討論變數x和y之間原有關係不為零的情況:
≠0,也可討論原有關係為零的情況:
=0。因為偏相關係數
和原有相關係數
存在以下關係式:
當
=0,
≠0,
≠0,且
和
異號時,則
>0。它表示變數 x和y之間的關係,只有當變數z得以控制後方被釋放出來。所以美國學者M.羅森伯格稱z為壓抑變數,而原有相關
=0是虛假的,或稱虛假的零相關。羅森伯格還設想了
和
可能反向的情況。它表示原有相關係數的極性(正向或反向),實際是歪曲了事實的真相,只有當變數 z得以控制後,變數x和y之間相關的真實極性才得以顯示,這種情況下的控制變數 z稱作歪曲變數。
多因分析
研究社會現象的產生是若干原因共同作用的模型(圖3):y=α11x1+α12x2+……α1nxn多因分析除了多元迴歸外,還可將回歸與相關技術結合起來,稱作典型相關分析技術。例如採用迴歸技術,用一組變數測定人們的社會經濟地位,用另一組變數測定人們的現代化觀念,就可採用典型相關分析來分析社會經濟地位和現代化觀念之間的關係(見迴歸分析)。
多因分析中的因變數又可能同時是另一變數的自變數,從而形成多級的因果鏈(圖4),這時可採用路徑分析技術。
多變數的綜合與提取
當多個變數間存在一定的相關性時,可利用聚類分析、因素分析、主成分分析法對資訊進行綜合、提取與歸類(見因子分析)。
多變數分析在社會研究中的應用正逐步得到推廣。但各種統計技術的運用,無不取決於模型的選擇,而模型的選擇是帶有主觀性的,研究者必須對研究物件作深入的定性研究,以便主觀上作出符合客觀實際的模型選擇。