壟斷資本主義的經濟一體化
[拼音]:huigui fenxi
[英文]:regression analysis
一種研究與測度變數之間關係的技術。對具有相關關係的現象,擇一適當的數學關係式,用以說明一個或一組變數變動時,另一變數或一組變數平均變動的情況,這種關係式稱為迴歸方程。如果所擇關係式是線性的,就稱為線性迴歸分析;反之,則稱為非線性迴歸分析。線性迴歸是迴歸分析的基本模型,很多複雜的情況都是轉化為線性迴歸進行處理的,因此線性迴歸分析並不限於線性模型。迴歸分析是社會研究中進行定量分析的基本方法,主要解決以下3個方面的問題:
(1)確定幾個變數間是否存在相關關係(見相關分析);若存在,則找出它們之間合適的數學表示式。
(2)據一個或幾個變數值,預測或控制另一個或幾個變數的值,且要知道這種控制或預測可達何種精確度。
(3)進行因素分析,即在共同影響一個變數的多個變數(因素)間,找出主要和次要因素及其相互關係。根據變數的數目,線性迴歸可分為以下幾種。
一元線性迴歸
建立一元線性迴歸方程
尳=α+bx來表示兩個變數。例如受教育年限與家庭收入之間的關係。式中x是自變數,y是因變數,α是常數,b是迴歸係數。尳表示當x取某一數值時,根據以上回歸方程所計算的對總體y的平均值的估計值。
復回歸
用多元線性方程尳=α+b1x1+b2x2+…+bnxn說明因變數y和一組自變數(x1,x2,…xn)。例如,因變數受教育年限y與自變數家庭收入 x1、本人智力因素x2、健康狀況x3、社會環境x4、……間的關係。式中x為自變數的個數,尳為x1,x2,…,xn取定值時,總體y的均值估計值。
多變數復回歸
建立可表達x個自變數(x1,x2,…,xn)與P個因變數(y1,y2,…,yp)間關係的多元線性方程組
式中尳為根據迴歸方程預測總體均值的估計值。
復回歸與多變數復回歸都可稱作多元線性迴歸。迴歸分析中的迴歸係數bi是在除去所有變數的影響後,xi對y的影響,即自變數變化一個單位而使y平均改變的數值。這是對總體作一定的測定後,根據樣本觀測值採用最小二乘法求得的。在求得一個迴歸方程後,還要考察它的效果如何,它對變數間關係的描述是否準確,如何利用它根據一組給定的自變數的值預測因變數的值,預測的精度如何。為此,必須對迴歸進行統計檢驗。在多元迴歸中,為了確定自變數的主次和重要性,可先將回歸方程標準化,此時的迴歸係數稱為標準迴歸係數,標準迴歸係數大的,相應變數的作用越重要。多元迴歸的另一個問題是,如何在眾多的因素中“挑選”變數,以建立對一組觀測資料“最優”的方程,包含所有對因變數y顯著的自變數和剔除對y不顯著的變數,常用的方法為逐步迴歸,即從一個自變數開始,逐個把變數引入迴歸方程,隨時檢驗,隨時剔除不合格者。多元迴歸中的自變數,要避免引入相互關係很強的變數。應用線性迴歸需注意以下幾點:
(1)線性迴歸模型要求因變數與自變數之間的關係是完全的直線關係,這一點在社會現象的研究中有時不能滿足。同時,自變數對因變數的影響,除了獨立作用外,往往還存在互動作用。在這種情況下,為了能使用線性迴歸,可以把非線性關係的每一個高次項,以及存在互動作用的乘積項xixj都看作是新的自變數,以滿足線性迴歸對自變數獨立作用的要求。
(2)迴歸分析要求變數層次都在定距以上(見測量層次)。對於自變數層次是定類的,可採用0,1虛擬變數的方法。如性別是定類變數,為了能使用迴歸分析,可在方程中設定一個虛擬變數D,並要求:
當D=0表示男性;
D=1表示女性。如果定類變數所分類別不止兩類,如文化程度分大學、中學和小學三類,這時可在迴歸方程中設定2個虛擬變數D1和D2,並要求:
當D1=0,D2=0表示小學文化程度;
D1=1,D2=0表示中學文化程度;
D1=0,D2=1表示大學文化程度。
(3)對於定序變數,如果所分等級較少,亦可採用虛擬變數的方法。如所分等級較多,亦可按定距變數處理。
迴歸分析與相關分析都是研究及測度變數間關係的技術。不同的是,相關分析是探討變數間關係的密切程度,迴歸分析則是探求變數間關係究竟為何種形式。兩種分析均可不依賴對方而獨自進行,通常對關係的兩個方面都進行分析。