基於因子分析的套利定價模型及實證研究

 摘 要:眾所周知,建立套利定價模型的關鍵在於因素的篩選,計算量很大。而因子分析能將為數眾多的原始指標變數經過分析綜合為少數幾個公共因子變數,從而大大減少計算的複雜度。本文利用因子分析的方法對11個因素進行篩選,確定四個能夠很好地反映所有因素包含的資訊但又互不相關的公共因子變數,並建立套利定價模型,實證檢驗說明,通過該方法進行因素篩選建立的套利定價模型具有較好的定價效果。?

  關鍵詞:因子分析;套利定價理論;股市;模型??
  
  一、問題的提出?
  
  1976年,Stephen Ross提出了著名的資產定價模型——套利定價理論(Arbitrage Pricing Theory,APT)。該理論假設任何風險證券的收益率受K個因素的影響,由一個K-因素線性模型給出:?

  r?i=a?i+?kk=1b?ikf?k+ε?i, i=1,2,…,n(1)?
  其中:E(ε?i)=E(f?k)=E(ε?iε?j)=E(ε?if?k***=0;E***ε?2?i***=s?2?i<S?2;r?i為第i種風險證券的收益率;a?i表示所有影響風險證券收益率的因素都為零時風險證券i的平均收益率;f?k表示第k個因素的值;b?ik表示風險證券i對第k個因素的敏感性;ε?i為隨機擾動項。?
  當不存在漸進套利機會時,由K-因素線性模型可以得到如下的近似定價模型——套利定價模型(APT):?
  E(r?i)=a?i≈λ?0+?Kk=1b?ikλ?k(2)?
  其中,λ?k稱為風險證券i對第k個因素的風險溢價。如果將誤差記為v?i≡a?i-λ?0-?Kk=1b?ikλ?k,則當不存在漸進套利機會時,有limn→∞1n?ni=1v?2?i=0。?
  建立套利定價模型的關鍵在於因素的篩選。然而,一種風險證券的收益率受多方面因素的影響,同時我們也不知道究竟需要多少個因素來構造APT。假設有n個因素對證券的收益率有影響,則可能有?nm=1C?m?n種因素的組合。要從如此眾多的因素組合中篩選出最優的因素組合,其計算量可想而知。?
  一般來說,因子的辨識和確定有兩種基本的方法:統計方法和推理方法。統計方法涉及從一個全面的資產收益集(通常遠超過用來估計和檢驗的樣本資產收益)來確定因子,採用這些收益的樣本資料來構造表示因子的資產組合,如Connor 和 Korajczyk(1988)、Lehmann 和 Modest(1988),前者使用因子分析方法,後者利用主元分析方法。推理方法是基於捕捉經濟的系統風險原則來辨識因子的,例如Fama 和 French(1988,1996)使用公司特徵來構建因子資產組合。?
  在這類研究中,Roll 和 Ross ***1986)的論文是一篇經典文獻,其研究方法為後來的眾多學者所採用。在將股票分組後,對每一組股票首先採用因子分析方法來估計影響股票收益率的因子數目,並估計每隻股票的因子載荷;然後,利用股票收益率資料和已估計出的因子載荷做橫截面迴歸,估計因子的風險溢價,進而檢驗多因子模型的適用性。此外,由於APT認為股票收益率的風險可以分為可分散風險和不可分散風險,其中可分散風險部分的均值為零,在大樣本中可忽略不計,而不可分散風險部分由K個共同因子決定,並通過K個因子係數反映股票收益率與每個非零風險溢價之間的關係。但是,現實中可能某一變數本身與不可分散風險不相關(即不應當作為因子出現),但在APT模型中卻被不恰當定價,成為一個共同因子。雖然由實際資料生成的因子模型通過了顯著性檢驗,但卻無法肯定這些因子就是不可分散風險的溢價,也無法排除可分散風險成為共同因子的可能。鑑於此,我們有必要對APT進行“自方差”檢驗這裡用“自方差”只是一種強調性說法,其實質就是該項資產收益率的方差。。從長期來看,證券收益率的自方差與收益率均值之間總是保持很高的相關性,而自方差又是每一種證券所特有的,屬於可分散風險。如果APT有效,那麼單個證券的自方差就不應當對期望收益率起作用,因為APT認為只有不可分散的風險才對定價起作用,才可以成為定價因子。 “自方差”檢驗就是要證明單個股票收益率的自方差是否為共同因子,可否用於定價,要接受還是否定APT。鑑於此,他們也利用 “自方差”檢驗來對多因子模型做了補充研究。?
  到目前為止,我國在套利定價理論因素確定方面的研究並不多,主要是利用多元線性迴歸構造套利定價模型,這一方法的計算量大,其包含的因素要麼過多要麼不全面,而且因素之間的關聯程度較高。?
  而因子分析是一種常用的統計降維技術,能夠利用原始指標變數中某些指標之間的相關性對多變數的面板資料進行最佳綜合和簡化,將為數眾多的指標綜合為少數幾個公共因子,以較少的幾個公共因子變數反映原始指標變數的大部分資訊,從而大大降低了分析問題的難度。?
  另外,因子分析法具有兩個獨特的優點:?
  (1)公共因子變數是根據原始指標變數的資訊進行綜合簡化得到的。一方面大大減少了變數數目,將為數眾多的原始指標變數縮減為極少數幾個公共因子變數;另一方面又儘可能保留了大部分原始指標變數的資訊,是對某些原始指標變數資訊的綜合和反映,仍然具有命名解釋性。?
  (2)通過對原始指標變數進行綜合和簡化得到的公共因子變數之間基本上不存線上性相關性,更利於對變數進行分析。?
  正是因子分析的這些特點以及APT對因子組合的要求決定了因子分析適合對APT的因素進行綜合和簡化。因此,本文引入了因子分析法對APT的因素進行篩選。?
  
  二、用因子分析法確定APT中的因素組合?
  
  在已有的研究中,一般認為APT中至少包含有三類不同的因素:反映總體經濟活動的指標、通貨膨脹率以及某些型別的利率因素。鑑於此,本文將國民生產總值、工業生產總值、第二產業生產總值、第三產業生產總值、全國居民消費水平、通貨膨脹率、全社會固定資產投資增長速度、社會消費品零售總額、貨幣供應總量、年淨出口貿易總額、利率期限結構等11個因素作為原始指標變數,利用我國1980年到2003年《統計年鑑》中的資料進行因子分析。?
  
  (一) 對原始指標變數進行相關性分析?
  因子分析從眾多的原始指標變數中構造出少數幾個具有代表意義的公共因子變數,它要求原始指標變數之間要具有比較強的相關性,否則就無法從中綜合出能反映某些變數共同特性的少數公共因子變數來,原始指標變數就不適於進行因子分析。因此,在因子分析之前需要對原始指標變數進行相關性分析。?
  本文采用的是KMO(Kaiser-Meyer-Olkin)檢驗和Bartlett球度檢驗。統計量KMO的值為0.771,大於0.6,根據統計學家 Kaiser給出的標準,原始指標變數適合做因子分析;Bartlett球度檢驗給出的自由度為55的卡方近似值為780.924,相伴概率為 0.000,小於顯著水平0.05,適合進行因子分析。由KMO檢驗和Bartlett球度檢驗結果可知,原始指標變數適合做因子分析。?
 與此同時,本文還對11個原始指標變數進行了反映像相關矩陣檢驗,在反映像相關矩陣中,所有偏相關係數的絕對值均小於0.05,說明所有的原始指標變數都適於進行因子分析。?
  
  (二) 構造公共因子變數?
  構造公共因子變數是因子分析的一個核心問題。因子分析中確定公共因子變數的方法很多,本文采取的是主元分析法。?
  1.確定保留公共因子變數的數目?
  根據公共因子變數與其特徵值的散點圖(圖1)可以看出,前面4個公共因子變數的特徵值變化非常明顯,從8.744到0.126,而從第5個公共因子變數開始,特徵值的變化趨於平穩。這說明提取前4個公共因子變數對原始指標變數的資訊描述有顯著作用。為了能夠得到更精確的APT,本文確定保留4個公共因子變數。?
  2.因子分析效果(見表1) ?
  因子分析的最終解解釋了每個原始指標變數99.5%以上的方差,每個原始指標變數的共同度幾乎都在98%以上,與1非常接近,也就是說,原始指標變數所攜帶的資訊不能被公共因子變數解釋的部分不到2%。這說明提取出的公共因子變數基本上已經反映了原始指標變數所有的資訊,只有極少數資訊丟失。可見,因子分析的效果非常好。?
  3.因子提取和因子旋轉的結果(表略) ?
  根據公共因子變數與其特徵值的散點圖的判斷,本文提取了四個公共因子變數對原始指標變數總體進行描述。這4個公共因子變數的方差貢獻(特徵值)分別為 8.744、1.348、0.729和0.126。由11個公共因子變數構成的初始解中,前四個公共因子變數解釋了原始指標變數總方差的99.522%,尤其是第一個公共因子變數,解釋了11個原始指標變數總方差的79.490%。?
  在進行因子旋轉以後,這四個公共因子變數的特徵值分別為8.444、1.231、1.102和0.171,分別可以解釋原始指標變數的76.192%、11.194%、10.014%和1.552%,共解釋了11個原始指標變數總方差的99.522%。?
  可見,提取的四個公共因子變數反映了原始指標變數的幾乎所有資訊,能夠代替11個原始指標變數構造多因素線性模型。?
   (三) 公共因子變數的命名解釋?
  公共因子變數的命名解釋是因子分析法的又一核心問題。原始指標變數都是具有具體經濟含義的變數,經過主成分分析以後,對這些變數進行了線性變換,得到的新的公共因子變數對原始指標變數進行了綜合和簡化。因此,有必要對新的公共因子變數進行解釋,以進一步說明影響原始指標變數系統構成的主要因素和系統特徵。本文采用方差極大法對因子負荷矩陣進行旋轉得到公共因子變數和原始指標變數之間的關係。?
  1.旋轉前後因子負荷矩陣(見表2) ?
  從表2可以看出,在進行因子旋轉前,除了通貨膨脹率、全社會固定資產投資增長速度和利率期限結構三個原始指標變數外,其他8個反映一個國家總體經濟狀況情況的原始指標變數對第一個公共因子變數的荷載都很大,絕對值均在0.9以上;年淨出口貿易總額、通貨膨脹率、全社會固定資產投資增長速度和利率期限結構對第二個公共因子變數的荷載都比較大;而通貨膨脹率、全社會固定資產投資增長速度則同時對第三個公共因子變數有較大的荷載;通貨膨脹率、年淨出口貿易總額和利率期限結構同時對第四個公共因子的荷載比較大。可見,四個因子中有一些資訊重合了,一個公共因子變數在很多原始指標變數上都有較高的荷載,不易於對公共因子變數進行解釋並找到各個公共因子的經濟含義。因此,有必要對此結果進行轉換。?
  因子旋轉則可以使因子負荷矩陣更加簡單,每個公共因子變數在相應的原始指標變數上的荷載儘可能多地為零,而每個原始指標變數在對應的公共因子變數上的荷載的絕對值大的儘可能少。這樣,每個公共因子變數儘可能包含不同的資訊,不同的原始指標變數儘可能地包含在不同的公共因子變數中,從而,每個公共因子變數的含義更加明晰。?
  本文采用方差極大法對因子荷載矩陣進行了旋轉,旋轉之後,幾乎每個公共因子變數都具有了比較明確的經濟含義。?
  第一個公共因子變數主要反映了社會消費品零售總額、工業總產值、第二產業生產總值、全國居民消費水平、國民生產總值、第三產業生產總值、貨幣供應總量和年淨出口貿易總額等8個反映一個國家總體經濟水平的原始指標變數的資訊;第二個公共因子變數主要反映通貨膨脹率的相關資訊;第三個公共因子變數反映的是全社會固定資產投資增長速度的資訊;第四個公共因子變數則是反映利率期限結構的狀況。基本上每個原始指標變數已經被歸於某一個公共因子變數中。可以說,旋轉的效果還是不錯的。?
  2.公共因子變數的命名解釋?
  由上面的分析可知,第一個公共因子變數主要反映一個國家總體經濟水平,第二個公共因子變數主要反映通貨膨脹率,第三個公共因子變數反映了全社會固定資產投資增長速度,第四個公共因子變數反映了利率期限結構。由此可以看出,風險證券的預期收益率主要與國家的總體經濟水平有關,同時還與國內的通貨膨脹率、全社會固定資產投資增長速度、利率期限結構這三個因素有關。?
  統計分析表明,這四個公共因子變數都是均值為0,方差為1的隨機變數,同時兩兩之間完全不相關。因此很適合作為APT的因素。?
  
  三、APT的實證檢驗?
  
  經由以上分析,確定了國家總體經濟水平、通貨膨脹率、全社會固定資產投資增長速度和利率期限結構四個公共因子變數,並通過公共因子得分由11個原始指標變數1980-2003年的年資料計算出了這四個公共因子變數相應的值。為了構造套利定價模型,本文首先根據式(1),選取了廣電電子、愛使股份、華源製藥、方正科技等十隻股票1995年到2005年的年收益率分別作為被解釋變數,以四個公共因子變數相應的1995年到2005年的資料為解釋變數進行了多元線性迴歸,得到每隻股票的a?i、b?i1、b?i2、b?i3和b?i4;然後根據式(2),以a?i為被解釋變數,b?ik***k=1,2,3,4***為解釋變數再次進行多元線性迴歸,得到套利定價模型:?
  a?i=0.189-1.051λ?1+0.02067λ?2-0.0233λ?3-0.238λ?4(3)?
  在式(3)中,我們注意到:一方面,風險證券i只是對通貨膨脹率的敏感性為正數,即風險證券i對通貨膨脹率的風險溢價越大,該證券的期望收益率也就越大;另一方面,風險證券i對國家總體經濟水平、全社會固定資產投資增長速度和利率期限結構的敏感性均為負數,即風險證券i對通貨膨脹率等的風險溢價越大,該證券的期望收益率也就越小。?
  為了檢驗本文得到的套利定價模型的效果,本文另外選取ST興業、豫園商城、金盃汽車、深達聲、ST億安等10只股票,利用式(3)對其進行定價,以模型預測值和實際平均收益率的差異作為評價模型的標準。由於APT只是一個近似的定價模型,應用於個別股票可能存在較大誤差,所以常用來對投資組合進行定價。因此本文構造以上十隻股票的簡單等權組合,用y=1n?ni=1***r?i預測-r?i?實際***?2度量誤差,計算結果為y=0.129。?
  實證檢驗表明,本文得到的套利定價模型(3)具有較好的定價效果,但仍存在12.9%的定價誤差。本文認為可能是由於如下原因造成的:?
  我國對巨集觀經濟指標的統計起步較晚,很多巨集觀經濟指標的資料不齊全,統計標準也不太一致,而且2000年以前的巨集觀經濟指標基本上只有年資料,由此造成可供利用的樣本資料太少。與此同時,由於巨集觀經濟指標採用年資料,為了與之對應,股票的收益率也只能採用年資料,但我國股票市場只有12年左右的歷史,這進一步造成樣本容量最多隻可能為12。在構建APT時,為了儘可能地擴大樣本容量,本文只選取了有10年左右歷史的股票,造成股票數目較少,類別比較單一。因此在迴歸分析中可能導致迴歸方程的顯著性和擬合優度不高(本文在利用迴歸分析得到APT的過程中,確實發現有一些迴歸方程的顯著性和擬合優度不高),最終導致預測結果存在較大誤差。本文相信,如果有更好的樣本資料,我們能夠進一步減小APT的定價誤差。?
 四、結論?
  
  本文通過引入因子分析法,對國民生產總值、全國居民消費水平、全社會固定資產投資總額、通貨膨脹率、利率期限結構等11個因素進行了綜合和簡化,提取了 4個具有明確經濟意義的公共因子,分別反映了國家總體經濟水平、通貨膨脹率、全社會固定資產投資增長速度和利率狀況。有關的統計分析說明因子分析法提取的這四個公共因子變數效果非常好。本文利用這四個公共因子變數構建了套利定價模型,並對模型進行了實證檢驗。實證檢驗表明,本文通過因子分析法進行因素篩選得到的套利定價模型具有較好的定價效果。?
  ?
  參考文獻?
  汪濤, 饒海斌. . 2002.單位根和協整分析[J].統計研究***5***. ?
  張妍.2000.套利定價理論在中國上海股市的經驗檢驗[J].世界經濟***10***. ?
  CONNOR G, KORAJCZYK R.1988.Risk and return in an equilibrium APT: application of a new test methodology [J].Journal of Financial Economics, 21: 255-290. ?
  FAMA E, FRENCH K.1988.Dividend yields and expected stock returns [J].Journal of Financial Economics, 22: 3-27. ?
  FAMA E, FRENCH K.1996.Multifactor explanations of asset pricing anomalies [J].Journal of Finance, 51:55-84. ?
  LEHMANN B, MODEST D.1988.The empirical foundations of the arbitrage pricing theory [J].Journal of Financial Economics, 21:213-254. ?
  ROLL R, ROSS S.1986.Economic forces and the stock market [J].Journal of Business, 59: 383-403.