中国沪深股市收益率相关性的实证分析
一、数据的来源与变换
本文选取上证综合指数与深证成分指数交易日的收盘价,样本范围为2007年1月5日至2009年12月18日,共973个观察值,全部数据来源于万德资讯金融终端。对原始数据序列取对数,并采用对数一阶差分表示收益率,即RSHt=lg(shinxt)-lg(shinxt-1),RSZt=lg(szinxt)-lg(szinxt-1)。
二、样本数据的基本统计特征
首先对收益率序列作描述性统计分析,结果显示:时间序列RSHt和RSZt正态分布(S=0,K=3)相比,均呈现左偏。Jarque-Bera正态性检验值为189.510888和115.196106,P值俊等于0,表明至少可以在99%的置信水平下拒绝零假设,即序列不服从正态性分布。
三、序列的平稳性检验
本文采用扩展的Dickey-Fuller(ADF)检验,假设上证指数收益率序列在0均值上下波动,所以采用无时间趋势的回归模型。取k=5进行检验,结果显示RSH和RSZ的T-test statistic 分别为-30.99307和-29.66630,均小于1%显著水平上的临界值-3.440,所以拒绝序列存在单位根的零假设,因此上证综指日收益率时间序列和深证成指日收益率时间序列均序列不存在单位根,是显著平稳的。
四、序列的自相关性
分别作出RSHt的自相关图和偏自相关图,从相关系数、自相关图和LB-Q统计量中可以看出,上证综指日收益率序列一阶不存在相关性,但是2阶以后的自相关系数和偏相关系数有反复波动增减的现象,虽然幅度不大,但是从LB-Q统计量得知,在5%的显著性水平下,上证收益率存在16阶和24阶高阶自相关。
尝试用ARMA(p,q)来估计上证指数收益率与其自身滞后量的关系,分别令p=1~5;q=1~5;利用AIC和SBIC来筛选,根据结果:无论是以AIC还是SBIC为准则,都应选择ARMA(3,3)。同时我们从序列RSH的自相关图和偏自相关图中可以发现,序列RSH在第三阶开始有2次明显的上升,我们认为可以尝试使用ARMA(||1,3||,||1,3||)来解释序列。
接下来用Box-Jenkins方法估计和识别上述两个模型,其Ljung-Box的Q统计量均不显著,即接受残差无显著自相关的假设。而ARMA(3,3)的AIC和SBIC指数都要优于ARMA(||1,3||,||1,3||),所以ARMA(3,3)能够比较好地拟合上证综合指数收益率。
接着,利用拉格朗日乘数检验对ARMA(3,3)残差进行ARCH效应检验。选择滞后5阶,Chi-Squared(5)为29.208608,Significance Level为0.00002110。ARMA(3,3)的残差存在明显的ARCH效应。接下来本文引入外生变量来拟合上证综合指数的均值,同时结合异方差模型来分析。
五、上证指数日收益率与深成指数日收益率相关性分析
沪深股市相似的结构和相同的环境应该使得二者收益率有很强的相关性。于是,我们将RSZt-1和RSHt-1作为RSHt的解释变量进行简单线性回归。同时,我们不做检验而直接引入GARCH来捕捉回归方程残差的异方差现象。这是因为股指收益的波动率普遍存在群聚、尖峰厚尾的现象。一般来说,GARCH(1,1)模型已能很好的捕捉残差高阶自相关现象,构建模型:
结果如表1。RSZt-1和RSHt-1的系数都不显著,GARCH(1,1)模型的各项参数都是显著不为零的,说明了群聚、尖峰厚尾的现象的存在。标准化后残差平方的LB-Q值均不显著,即经过处理后残差不存在异方差现象。但是,标准化后的残差仍然存在自相关现象,于是考虑引入描述波动非对称性的EGARCH进一步分析,构建如下模型:
~N(0,1)
结果如表2。和GARCH(1,1)模型一样,两市日收益率滞后一项都不显著。两个模型中,RSHt-1对其当期RSHt的影响也都是不显著的,这说明前一日上证市场的信息已反映在该日收益率中,上证市场是弱有效的。沪深两个市场属同一个金融市场范畴,对上证股票市场有冲击的系统性信息必然也能迅速地反应在深证市场当日股指收益率里,沪深股市有显著的同步特征。所以,RSHt与RSZt-1的不显著相关性并不说明RSHt应该与RSZt的相关性不显著,这是沪深市场有效性特征的反映。
非对称性波动率模型中所有参数的系数都是显著不为零的,说明上证综指收益率存在着波动的群聚性、收益率分布的尖峰厚尾特征和波动的非对称性。=0.968,接近于1,说明一个新的冲击对收益率的影响持续很长一段时间。< 0说明负面消息的冲击比正面的更能引起收益率较大波动。=0.196,则说明当期收益率波动的20%可由前一期残差的绝对值来解释。
在引入EGARCH后,标准化后的残差在5%的显著性水平下仍然存在自相关,但是其平方值(波动率)不具有明显的自相关性,与GARCH模型结果一致。由此推断,残差自相关是均值方程无法很好的拟合因变量产生的,因为GARCH(1,1)模型和EGARCH模型中的两个自变量都是不显著的,对应变量没有明显的解释力,其次,我们合理的运用了GARCH(1,1)模型和EGARCH模型来捕捉存在的异方差现象。所以,残差的自相关性与异方差现象无关,是均值拟合方程没有解释这一部分收益率的原因。
表1 GARCH(1,1)的回归结果
注:每个系数给出了在估计值等于零的假设下所对应的P值。*、**、***分别代表10%、5%、1%显著性水平
表2 EGARCH回归结果
注:每个系数给出了在估计值等于零的假设下所对应的P值。*、**、***分别代表10%、5%、1%显著性水平
六、结论与启示
1、上证综指和深证成指日收益率均存在较大波动,沪深两市日收益率序列均不服从正态分布,尖峰厚尾性显著,波动存在簇族性。可用GARCH(1,1)模型和EGARCH模型来拟合收益率序列的波动性。
2、上证综合指数日收益率自相关性较弱,沪市当前的股价信息对后市走势影响较小。所以,从有效性上看,沪市有效性较强。
3、上证综指当日收益率和深证成指前一日收益率之间相关性不显著,即深市对沪市收益率的溢出效应不显著,但是不能因此得出沪深两市不存在相互作用和影响。