桃花塢年畫
[拼音]:xiangguan fenxifa
[英文]:method of correlation analysis
用於研究社會經濟現象數量依存關係的一種數理統計方法。包括相關分析與迴歸分析。相關分析是對兩個對等的經濟數列,用數學方法測定一個反映它們之間變動的聯絡程度和聯絡方向的抽象化數值,即相關係數。迴歸分析是在兩個或兩個以上有聯絡的經濟數列中,確定一個為因變數數列,其他為自變數數列,為它們配合一定的數學模型(見經濟計量分析),並用統計方法(如常用的最小平方法)估計模型引數,得出迴歸方程,作為根據自變數值估計因變數值的依據。一個因變數與一個自變量回歸,稱單迴歸;一個因變數與兩個或兩個以上自變量回歸,稱復回歸。迴歸的表現形式有直線迴歸與非直線迴歸。迴歸估計是以給定的自變數值代入迴歸方程中求得估計的因變數平均值。這個平均值有誤差,誤差的代表值是估計標準誤差。相關係數、迴歸方程和估計標準誤差是相關分析法三個有密切聯絡的主要組成部分。最簡單、最基本的相關分析法是兩變數之間的直線相關和迴歸。
直線相關係數計算方法
設x和y為兩個不分因變數和自變數的對等變數, n代表成對變數值數目,則相關係數r的算式為:
r值在+1與-1之間,其值越接近±1,表示兩變數直線相關的程度越高,越接近零,則相關程度越低;正號r值表示兩變數有同增同減的同方向變動關係,而負號r值則表示一增一減的異方向變動關係。
直線迴歸分析方法
直線迴歸的一般方程式是yc=a+b x,式中的x是自變數,y是因變數,稱y倚x迴歸方程。在兩變數互為因果關係(如身高與體重)的資料中,還可計算另一條對應的迴歸線:x倚y迴歸線,即xc=a′+b′y。在y倚x迴歸方程中,只能根據給定的x值估計平均的y值,而不能反過來給定y值估計x值;同樣,在x倚y迴歸方程中,也只能根據給定的y值估計平均的x值,而不能反過來估計。在不是互為因果關係的資料(如每畝耕地施肥量與農作物產量資料)中,則只能計算一條迴歸線,進行單方向的估計。在y倚x迴歸方程中,用最小平方法估計引數a和b的公式是:
直線斜率 b如為正值,表明兩變數有正比變動關係;如為負值,則表明有反比變動關係。a是直線的截距。這條迴歸線的估計標準誤差算式是:
x 倚y迴歸線的a′、b′及S x算式同上,只是把x與y互換即可。
應用相關分析與迴歸分析要注意兩個問題:
(1)在資料上,相關分析要求兩個變數都必須是隨機的;而回歸分析則要求因變數必須是隨機的,自變數則不能是隨機的,而是規定的值,這與在迴歸方程中用給定的自變數值來估計平均的因變數值是一致的。
(2)防止虛假相關和虛假迴歸。在對兩個時間數列進行相關分析和迴歸分析時,常因各期指標值受時間因素的強烈影響而損傷了所需要的隨機性;也有時兩個時間數列表面上似有同升同降的變動,實際上並無本質聯絡。對這類資料求出的高度相關係數或迴歸聯絡,往往是一種假象。為此,在用相關分析法研究複雜的社會經濟現象時,需要有科學的理論指導和正確的判斷。