基于因子分析的套利定价模型及实证研究
摘 要:众所周知,建立套利定价模型的关键在于因素的筛选,计算量很大。而因子分析能将为数众多的原始指标变量经过分析综合为少数几个公共因子变量,从而大大减少计算的复杂度。本文利用因子分析的方法对11个因素进行筛选,确定四个能够很好地反映所有因素包含的信息但又互不相关的公共因子变量,并建立套利定价模型,实证检验说明,通过该方法进行因素筛选建立的套利定价模型具有较好的定价效果。?
关键词:因子分析;套利定价理论;股市;模型??
一、问题的提出?
1976年,Stephen Ross提出了著名的资产定价模型——套利定价理论(Arbitrage Pricing Theory,APT)。该理论假设任何风险证券的收益率受K个因素的影响,由一个K-因素线性模型给出:?
r?i=a?i+?kk=1b?ikf?k+ε?i, i=1,2,…,n(1)?
其中:E(ε?i)=E(f?k)=E(ε?iε?j)=E(ε?if?k)=0;E(ε?2?i)=s?2?i<S?2;r?i为第i种风险证券的收益率;a?i表示所有影响风险证券收益率的因素都为零时风险证券i的平均收益率;f?k表示第k个因素的值;b?ik表示风险证券i对第k个因素的敏感性;ε?i为随机扰动项。?
当不存在渐进套利机会时,由K-因素线性模型可以得到如下的近似定价模型——套利定价模型(APT):?
E(r?i)=a?i≈λ?0+?Kk=1b?ikλ?k(2)?
其中,λ?k称为风险证券i对第k个因素的风险溢价。如果将误差记为v?i≡a?i-λ?0-?Kk=1b?ikλ?k,则当不存在渐进套利机会时,有limn→∞1n?ni=1v?2?i=0。?
建立套利定价模型的关键在于因素的筛选。然而,一种风险证券的收益率受多方面因素的影响,同时我们也不知道究竟需要多少个因素来构造APT。假设有n个因素对证券的收益率有影响,则可能有?nm=1C?m?n种因素的组合。要从如此众多的因素组合中筛选出最优的因素组合,其计算量可想而知。?
一般来说,因子的辨识和确定有两种基本的方法:统计方法和推理方法。统计方法涉及从一个全面的资产收益集(通常远超过用来估计和检验的样本资产收益)来确定因子,采用这些收益的样本数据来构造表示因子的资产组合,如Connor 和 Korajczyk(1988)、Lehmann 和 Modest(1988),前者使用因子分析方法,后者利用主元分析方法。推理方法是基于捕捉经济的系统风险原则来辨识因子的,例如Fama 和 French(1988,1996)使用公司特征来构建因子资产组合。?
在这类研究中,Roll 和 Ross (1986)的论文是一篇经典文献,其研究方法为后来的众多学者所采用。在将股票分组后,对每一组股票首先采用因子分析方法来估计影响股票收益率的因子数目,并估计每只股票的因子载荷;然后,利用股票收益率数据和已估计出的因子载荷做横截面回归,估计因子的风险溢价,进而检验多因子模型的适用性。此外,由于APT认为股票收益率的风险可以分为可分散风险和不可分散风险,其中可分散风险部分的均值为零,在大样本中可忽略不计,而不可分散风险部分由K个共同因子决定,并通过K个因子系数反映股票收益率与每个非零风险溢价之间的关系。但是,现实中可能某一变量本身与不可分散风险不相关(即不应当作为因子出现),但在APT模型中却被不恰当定价,成为一个共同因子。虽然由实际数据生成的因子模型通过了显著性检验,但却无法肯定这些因子就是不可分散风险的溢价,也无法排除可分散风险成为共同因子的可能。鉴于此,我们有必要对APT进行“自方差”检验这里用“自方差”只是一种强调性说法,其实质就是该项资产收益率的方差。。从长期来看,证券收益率的自方差与收益率均值之间总是保持很高的相关性,而自方差又是每一种证券所特有的,属于可分散风险。如果APT有效,那么单个证券的自方差就不应当对期望收益率起作用,因为APT认为只有不可分散的风险才对定价起作用,才可以成为定价因子。 “自方差”检验就是要证明单个股票收益率的自方差是否为共同因子,可否用于定价,要接受还是否定APT。鉴于此,他们也利用 “自方差”检验来对多因子模型做了补充研究。?
到目前为止,我国在套利定价理论因素确定方面的研究并不多,主要是利用多元线性回归构造套利定价模型,这一方法的计算量大,其包含的因素要么过多要么不全面,而且因素之间的关联程度较高。?
而因子分析是一种常用的统计降维技术,能够利用原始指标变量中某些指标之间的相关性对多变量的面板数据进行最佳综合和简化,将为数众多的指标综合为少数几个公共因子,以较少的几个公共因子变量反映原始指标变量的大部分信息,从而大大降低了分析问题的难度。?
另外,因子分析法具有两个独特的优点:?
(1)公共因子变量是根据原始指标变量的信息进行综合简化得到的。一方面大大减少了变量数目,将为数众多的原始指标变量缩减为极少数几个公共因子变量;另一方面又尽可能保留了大部分原始指标变量的信息,是对某些原始指标变量信息的综合和反映,仍然具有命名解释性。?
(2)通过对原始指标变量进行综合和简化得到的公共因子变量之间基本上不存在线性相关性,更利于对变量进行分析。?
正是因子分析的这些特点以及APT对因子组合的要求决定了因子分析适合对APT的因素进行综合和简化。因此,本文引入了因子分析法对APT的因素进行筛选。?
二、用因子分析法确定APT中的因素组合?
在已有的研究中,一般认为APT中至少包含有三类不同的因素:反映总体经济活动的指标、通货膨胀率以及某些类型的利率因素。鉴于此,本文将国民生产总值、工业生产总值、第二产业生产总值、第三产业生产总值、全国居民消费水平、通货膨胀率、全社会固定资产投资增长速度、社会消费品零售总额、货币供应总量、年净出口贸易总额、利率期限结构等11个因素作为原始指标变量,利用我国1980年到2003年《统计年鉴》中的数据进行因子分析。?
(一) 对原始指标变量进行相关性分析?
因子分析从众多的原始指标变量中构造出少数几个具有代表意义的公共因子变量,它要求原始指标变量之间要具有比较强的相关性,否则就无法从中综合出能反映某些变量共同特性的少数公共因子变量来,原始指标变量就不适于进行因子分析。因此,在因子分析之前需要对原始指标变量进行相关性分析。?
本文采用的是KMO(Kaiser-Meyer-Olkin)检验和Bartlett球度检验。统计量KMO的值为0.771,大于0.6,根据统计学家 Kaiser给出的标准,原始指标变量适合做因子分析;Bartlett球度检验给出的自由度为55的卡方近似值为780.924,相伴概率为 0.000,小于显著水平0.05,适合进行因子分析。由KMO检验和Bartlett球度检验结果可知,原始指标变量适合做因子分析。?
与此同时,本文还对11个原始指标变量进行了反映像相关矩阵检验,在反映像相关矩阵中,所有偏相关系数的绝对值均小于0.05,说明所有的原始指标变量都适于进行因子分析。?
(二) 构造公共因子变量?
构造公共因子变量是因子分析的一个核心问题。因子分析中确定公共因子变量的方法很多,本文采取的是主元分析法。?
1.确定保留公共因子变量的数目?
根据公共因子变量与其特征值的散点图(图1)可以看出,前面4个公共因子变量的特征值变化非常明显,从8.744到0.126,而从第5个公共因子变量开始,特征值的变化趋于平稳。这说明提取前4个公共因子变量对原始指标变量的信息描述有显著作用。为了能够得到更精确的APT,本文确定保留4个公共因子变量。?
2.因子分析效果(见表1) ?
因子分析的最终解解释了每个原始指标变量99.5%以上的方差,每个原始指标变量的共同度几乎都在98%以上,与1非常接近,也就是说,原始指标变量所携带的信息不能被公共因子变量解释的部分不到2%。这说明提取出的公共因子变量基本上已经反映了原始指标变量所有的信息,只有极少数信息丢失。可见,因子分析的效果非常好。?
3.因子提取和因子旋转的结果(表略) ?
根据公共因子变量与其特征值的散点图的判断,本文提取了四个公共因子变量对原始指标变量总体进行描述。这4个公共因子变量的方差贡献(特征值)分别为 8.744、1.348、0.729和0.126。由11个公共因子变量构成的初始解中,前四个公共因子变量解释了原始指标变量总方差的99.522%,尤其是第一个公共因子变量,解释了11个原始指标变量总方差的79.490%。?
在进行因子旋转以后,这四个公共因子变量的特征值分别为8.444、1.231、1.102和0.171,分别可以解释原始指标变量的76.192%、11.194%、10.014%和1.552%,共解释了11个原始指标变量总方差的99.522%。?
可见,提取的四个公共因子变量反映了原始指标变量的几乎所有信息,能够代替11个原始指标变量构造多因素线性模型。?
(三) 公共因子变量的命名解释?
公共因子变量的命名解释是因子分析法的又一核心问题。原始指标变量都是具有具体经济含义的变量,经过主成分分析以后,对这些变量进行了线性变换,得到的新的公共因子变量对原始指标变量进行了综合和简化。因此,有必要对新的公共因子变量进行解释,以进一步说明影响原始指标变量系统构成的主要因素和系统特征。本文采用方差极大法对因子负荷矩阵进行旋转得到公共因子变量和原始指标变量之间的关系。?
1.旋转前后因子负荷矩阵(见表2) ?
从表2可以看出,在进行因子旋转前,除了通货膨胀率、全社会固定资产投资增长速度和利率期限结构三个原始指标变量外,其他8个反映一个国家总体经济状况情况的原始指标变量对第一个公共因子变量的荷载都很大,绝对值均在0.9以上;年净出口贸易总额、通货膨胀率、全社会固定资产投资增长速度和利率期限结构对第二个公共因子变量的荷载都比较大;而通货膨胀率、全社会固定资产投资增长速度则同时对第三个公共因子变量有较大的荷载;通货膨胀率、年净出口贸易总额和利率期限结构同时对第四个公共因子的荷载比较大。可见,四个因子中有一些信息重合了,一个公共因子变量在很多原始指标变量上都有较高的荷载,不易于对公共因子变量进行解释并找到各个公共因子的经济含义。因此,有必要对此结果进行转换。?
因子旋转则可以使因子负荷矩阵更加简单,每个公共因子变量在相应的原始指标变量上的荷载尽可能多地为零,而每个原始指标变量在对应的公共因子变量上的荷载的绝对值大的尽可能少。这样,每个公共因子变量尽可能包含不同的信息,不同的原始指标变量尽可能地包含在不同的公共因子变量中,从而,每个公共因子变量的含义更加明晰。?
本文采用方差极大法对因子荷载矩阵进行了旋转,旋转之后,几乎每个公共因子变量都具有了比较明确的经济含义。?
第一个公共因子变量主要反映了社会消费品零售总额、工业总产值、第二产业生产总值、全国居民消费水平、国民生产总值、第三产业生产总值、货币供应总量和年净出口贸易总额等8个反映一个国家总体经济水平的原始指标变量的信息;第二个公共因子变量主要反映通货膨胀率的相关信息;第三个公共因子变量反映的是全社会固定资产投资增长速度的信息;第四个公共因子变量则是反映利率期限结构的状况。基本上每个原始指标变量已经被归于某一个公共因子变量中。可以说,旋转的效果还是不错的。?
2.公共因子变量的命名解释?
由上面的分析可知,第一个公共因子变量主要反映一个国家总体经济水平,第二个公共因子变量主要反映通货膨胀率,第三个公共因子变量反映了全社会固定资产投资增长速度,第四个公共因子变量反映了利率期限结构。由此可以看出,风险证券的预期收益率主要与国家的总体经济水平有关,同时还与国内的通货膨胀率、全社会固定资产投资增长速度、利率期限结构这三个因素有关。?
统计分析表明,这四个公共因子变量都是均值为0,方差为1的随机变量,同时两两之间完全不相关。因此很适合作为APT的因素。?
三、APT的实证检验?
经由以上分析,确定了国家总体经济水平、通货膨胀率、全社会固定资产投资增长速度和利率期限结构四个公共因子变量,并通过公共因子得分由11个原始指标变量1980-2003年的年数据计算出了这四个公共因子变量相应的值。为了构造套利定价模型,本文首先根据式(1),选取了广电电子、爱使股份、华源制药、方正科技等十只股票1995年到2005年的年收益率分别作为被解释变量,以四个公共因子变量相应的1995年到2005年的数据为解释变量进行了多元线性回归,得到每只股票的a?i、b?i1、b?i2、b?i3和b?i4;然后根据式(2),以a?i为被解释变量,b?ik(k=1,2,3,4)为解释变量再次进行多元线性回归,得到套利定价模型:?
a?i=0.189-1.051λ?1+0.02067λ?2-0.0233λ?3-0.238λ?4(3)?
在式(3)中,我们注意到:一方面,风险证券i只是对通货膨胀率的敏感性为正数,即风险证券i对通货膨胀率的风险溢价越大,该证券的期望收益率也就越大;另一方面,风险证券i对国家总体经济水平、全社会固定资产投资增长速度和利率期限结构的敏感性均为负数,即风险证券i对通货膨胀率等的风险溢价越大,该证券的期望收益率也就越小。?
为了检验本文得到的套利定价模型的效果,本文另外选取ST兴业、豫园商城、金杯汽车、深达声、ST亿安等10只股票,利用式(3)对其进行定价,以模型预测值和实际平均收益率的差异作为评价模型的标准。由于APT只是一个近似的定价模型,应用于个别股票可能存在较大误差,所以常用来对投资组合进行定价。因此本文构造以上十只股票的简单等权组合,用y=1n?ni=1(r?i预测-r?i?实际)?2度量误差,计算结果为y=0.129。?
实证检验表明,本文得到的套利定价模型(3)具有较好的定价效果,但仍存在12.9%的定价误差。本文认为可能是由于如下原因造成的:?
我国对宏观经济指标的统计起步较晚,很多宏观经济指标的数据不齐全,统计标准也不太一致,而且2000年以前的宏观经济指标基本上只有年数据,由此造成可供利用的样本数据太少。与此同时,由于宏观经济指标采用年数据,为了与之对应,股票的收益率也只能采用年数据,但我国股票市场只有12年左右的历史,这进一步造成样本容量最多只可能为12。在构建APT时,为了尽可能地扩大样本容量,本文只选取了有10年左右历史的股票,造成股票数目较少,类别比较单一。因此在回归分析中可能导致回归方程的显著性和拟合优度不高(本文在利用回归分析得到APT的过程中,确实发现有一些回归方程的显著性和拟合优度不高),最终导致预测结果存在较大误差。本文相信,如果有更好的样本数据,我们能够进一步减小APT的定价误差。?
四、结论?
本文通过引入因子分析法,对国民生产总值、全国居民消费水平、全社会固定资产投资总额、通货膨胀率、利率期限结构等11个因素进行了综合和简化,提取了 4个具有明确经济意义的公共因子,分别反映了国家总体经济水平、通货膨胀率、全社会固定资产投资增长速度和利率状况。有关的统计分析说明因子分析法提取的这四个公共因子变量效果非常好。本文利用这四个公共因子变量构建了套利定价模型,并对模型进行了实证检验。实证检验表明,本文通过因子分析法进行因素筛选得到的套利定价模型具有较好的定价效果。?
?
参考文献?
汪涛, 饶海斌. . 2002.单位根和协整分析[J].统计研究(5). ?
张妍.2000.套利定价理论在中国上海股市的经验检验[J].世界经济(10). ?
CONNOR G, KORAJCZYK R.1988.Risk and return in an equilibrium APT: application of a new test methodology [J].Journal of Financial Economics, 21: 255-290. ?
FAMA E, FRENCH K.1988.Dividend yields and expected stock returns [J].Journal of Financial Economics, 22: 3-27. ?
FAMA E, FRENCH K.1996.Multifactor explanations of asset pricing anomalies [J].Journal of Finance, 51:55-84. ?
LEHMANN B, MODEST D.1988.The empirical foundations of the arbitrage pricing theory [J].Journal of Financial Economics, 21:213-254. ?
ROLL R, ROSS S.1986.Economic forces and the stock market [J].Journal of Business, 59: 383-403.