经济学家

 找回密码
 快速注册

QQ登录

只需一步,快速开始

查看: 911|回复: 1

基于高频数据的沪港股市统计分析

[复制链接]
发表于 2012-3-31 18:22 | 显示全部楼层 |阅读模式
                                  
                                  
                                  

                    
                        
                      [摘 要] 对向量高频时间序列的“已实现”协方差阵提出相应的模型并建立了“已实现”向量自回归模型。基于高频数据,应用Engle等提出的协同持续概念,建立了小波神经网络理论的非线性协整持续模型。在此基础上通过沪港股市实证分析,表明沪港股市存在非线性协同持续关系。最后利用赋权“已实现”双幂变差进行Granger因果关系检验和脉冲响应函数,得到上海股市是上海股市的成因,从另一角度证实沪港股市的相关性。
  [关键词] 高频数据 协同持续 小波神经网络
  
  金融波动持续性和协同持续性的研究,是近年来金融计量经济学领域的热点问题之一。关于波动持续性和协同持续性的文献中有很多,但是这些都是以低频金融数据为研究对象,而针对高频金融数据给出的波动持续性和协同持续性的讨论国内外鲜有涉及。例如从单位根的角度对向量GARCH模型和向量SV模型分别重新给出协同持续的研究,由此给出在协同持续下确定组合配置(持续向量)的方法。基于向量GARCH模型,文献[3]利用上述组合配置的方法,通过实证说明了沪深股市不存在线性协同持续关系;进一步地,文献[ 4]通过小波神经网络方法证明了沪深股市存在非线性协同持续关系。以上这些研究大都是基于低频时间序列和沪深股市展开的,那么对于高频时间序列而言,更具研究意义沪港股市协同持续关系又如何呢?这就是本文所要研究的主要问题。
  金融风险的防范与规避一直是投资过程的核心问题。目前学术界十分关注香港股市与上海股市的关联关系。可能有两点原因,其一是就是两地资本市场之间人为障碍变少,使两地之间资本流动更加顺畅。另一方面的原因两地关联性的加强,使得在两地进行分散投资以降低风险的有效性大大降低,并且要求政府在制定资本市场政策时必须综合考虑另一个市场的波动因素可能带来的影响。所以本文研究两者统计计量分析有其必要性。
  一、基于高频数据的波动建模
  高频数据即日内数据,是指在开盘时间和收盘间之间进行抽样的交易数据,主要是以小时、分钟、甚至秒为抽样频率的、按时间顺序排列的时间序列。一般而言,金融市场的信息是连续影响金融资产价格运动过程的。抽样频率越低,市场信息损失就越多;反之,抽样频率越高,获取的市场信息就越多。从金融高频数据产生至今,对金融高频数据的分析一直是金融研究领域一个备受关注的焦点。自从Andersen等[5,6]将“己实现”波动引进金融计量分析以来,如何挖掘高频数据隐含的信息己经成为金融计量研究的又一个热点。然而,迄今为止高频时间序列的波动建模和持续性质研究文献鲜有讨论。为此,本文展开这方面的研究以期有助于进一步理解高频数据下的波动状况。
  在高频数据领域对波动率估计作出杰出贡献的是Anersen和Bollerslev等人,他们开创性的提出了“已实现”波动的概念,随后,仿照“已实现”波动的构建思路,不断涌现出了“已实现”波动的改进和扩展后的波动率估计量,这些估计量从不同的角度提高了估计量的统计性质。本文综合考虑在建模中采用赋权“已实现”双幂次变差。
  首先根据构建已实现协方差阵,把所有时刻t到时刻t+h的时段都等分成n个小时间段((h表示时间跨度,通常取h为1天),这样从时刻t到时刻t+h上的N维变量收益率向量为:
  其中为N维列向量,常表示收益率; 的条件期望;表示一个 维向量随机过程;表示从过去直到t-1时刻的所有已知信息集,为已实现协方差阵,而且是关于可测的。这里称为半向量算子,表示把矩阵的下三角依列累积而成的维向量。为方阵;W为维向量是条件方差(协方差)方程中的截距项; 为p阶滞后算子多项式;是维白噪声过程,且与不相关。
  从上面的论述可以看出,基于高频数据的RV-VAR模型和基于低频数据的多元GARCH模型虽然都可以用来研究多变量时间序列的波动及波动之间的相互影响,但是,这两种研究方法存在以下不同:
  1.“己实现”协方差阵和多元GARCH模型虽然都可以度量每日的波动率,但是,多元GARCH模型只是利用了日间数据,而”己实现”协方差阵是基于高频时间序列计算的,它充分地利用日内的信息.这说明”己实现”协方差阵更充分地利用了金融市场上的信息;
  2.多元GARCH模型把波动率和相关系数作为隐性变量,不能直接观测,需要首先进行模型的参数估计,然后才能得到波动率和相关系数的值。“己实现”协方差阵却不同,它把波动率和相关系数当作显性变量,不需要进行参数估计就可以直接计算当期的波动率和相关系数的值。
  3.多元GARCH模型参数的估计最多是二维的,维数高于二维以后参数估计变得异常困难.对高频而言,满足一定的条件就可以建立任意多维的“己实现”协方差阵,模型中参数估计只需用常规的GLS等之类的传统方法即可。
  二、基于高频数据的非线性协同持续建模
  为了探询高频波动的协整持续状况,下面从单位根的角度,以定理的形式给出RV- VAR模型存在线性协整持续的充要条件。
  RV-VAR过程的特征方程的 特征根为,依大小排列为为相应于这n个根的维右特征向量:则 关于条件方差是协整持续的,当且仅当,,使得:。
  但是金融市场是一个非线性系统,例如研究金融市场的混沌、分叉与分形都是研究它的非线性性质。有时,用线性组合的方法有时并不能消除持续性,但不等于不具有协整持续关系。刘丹红等(2004 )从短记忆的角度给出非线性协同持续的定义,并通过小波神经网络进行非线性协同持续建模,实证分析说明了沪深股市存在着非线性协同持续关系。
  对高频数据而言,协同持续的定义是通过线性组合的方法来消除或削弱向量的持续性,在此基础上创新利用小波神经网络技术进行非线性协同持续建模。
  非线性协同持续模型的建模步骤如下:
  第一步:检验第一步所建立的RV-VAR模型的系数多项式矩阵是否存在单位根,如存在单位根,知向量随机过程存在波动持续性。
  第二步:检验向量随机过程是否存在波动的线性协整持续关系,当不存在线性协整持续关系时,利用小波神经网络估计和检验是否存在非线性协整持续函数。
  第三步:检验输出序列,利用单位根进行平稳性检验,当显着不存在单位根时,网络输出序列为平稳时间序列,向量序列的非线性协整持续函数。
  三、实证分析
  本文选取的时间序列是2010/014-2010/06/28的上证综合指数(SH)和香港恒生指数(XG)的5分钟间隔的高频交易价对数价格,时间跨度为105个交易日。对一个指数每天采集了50个交易数据。分别表示上证综合指数和香港恒生指数收盘对数价格收益率,给出结果如下:
  从特征值的估计值可以看出,RV-VAR模型具有单位根,所以它是关于方差持续的。根据波动过程存在关于方差协同持续的充要条件,应是对模小于等于1的特征根所对应的特征向量v,使存在实数解:
  其中:取协同持续向量为 。
  明显,方程无实数解。综合上述讨论,虽然沪港两股市波动表现出波动持续性,但是两股市间并不存在可消除或削弱其波动持续性的线性组合,即不存在线性的波动协同持续。
  运用RV-VAR模型来证明沪港股市是否存在非线性协同持续性。下面利用前面提出的小波神经网络方法,建立非线性模型来探测沪港股市之间是否存在非线性协同持续关系。我们建立了具有二个输入节点,八个隐层节点和一个输出节点的单隐层小波神经网络,小波基函数采用Mallet小波。小波函数的模型为:

                                                          
                                  
                                  

                    
                        
                      选取的时间序列是2010/014-2010/06/28的上证综合指数(SH)和香港恒生指数(XG)的5分钟间隔的交易价对数价格共105组样本,前75组作为训练样本,后30组数据作为检验样本。利用75组训练样本,使用具有自适应学习速率的变尺度法对网络参数进行了训练,取学习步长0.1,动量系数0.3。
  为了检验所建立的网络能否反映沪港股市之间的非线性协同持续关系,将30对检验样本作为输入序列,利用训练好的网络产生35个输出样本,对输出样本进行单位根检验。经检验不存在单位根,所以认为输出序列是平稳的,由此说明基于高频数据沪港股市之间存在非线性协同持续关系,这与基于低频数据模型得出的结论是一致的。
  四、基于高频数据的G ranger因果关系检验和脉冲响应函数
  对高频数据而言,通过“已实现”波动理论,把波动转换成一个可观测的时间序列,这样就可以用常规的标准时间序列技术对高频时间序列进行建模。 在建模中采用赋权“已实现”双幂次变差,因为其不仅具有稳健性,还考虑了“日历效应”,同时是有效的波动率估计量。因此,赋权“已实现”双幂次变差是更准确的金融波动估计量,可以将其应用到金融波动的建模以更加准确的预测未来的波动率。在此基础上运用赋权“已实现”双幂次变差进行G ranger因果关系检验和脉冲响应函数。
  由G ranger因果关系检验,上证指数是香港恒生指数的成因。
  图1显示,上证指数与恒生指数对其自身1个单位的正冲击都立刻有较强的反应,收益率比初始的均衡水平分别增加了0. 052和0. 024个单位,接着持续回落,到第6天后就回到了原来的水平。 恒生指数对上证指数的影响很微弱,而上证指数对恒生指数的影响十分明显,第1天就达到0. 008,接着持续回落,到第6天后就回到了原来的水平。
  五、研究结论
  基于高频数据进行研究更能充分地利用金融市场价格运动中的信息。对于非线性经济系统,运用RV-VAR模型的非线性协同持续的概念,提出了用小波神经网络建立非线性协同持续模型的方法。通过对中国沪港股市高频数据的实证发现,虽然多维波动序列具有持续性,但不存在线性的协同持续关系,说明其风险的波动不能通过线性组合方式来消除。基于高频数据,利用赋权已实现双幂变差的G ranger因果关系检验,上证指数是香港恒生指数的成因。最后,同样基于高频数据,利用赋权已实现双幂变差的脉冲响应函数的实证方法从另一角度再度证实了相关性。
  
  参考文献:
  [1] Li H D, Zhang S Y.Common persistence and error correction model in conditional variance[ J].Journal of System Engineering,2001,10(3):257-264
  [2]李汉东 张世英:随机波动模型的持续性和协同持续性研究[J] .系统工程学报,2002, 17( 4) :289 -295.
  [3]张世英:樊智协整理论与波动模型:金融时间序列分析及应用[M]北京:清华人学出版社,2004.277-355
  [4]刘丹红 徐正国 张肚英:向量GARCH模型的非线性协同持续[J] .系统工程,2004, 22(6):33-38
  [5]Andersen T.G.,Tim Bollerslev.Answering the skeptics:yes,standard volatiliy midels do ptovide accurate forecasts[J].Internation Economic Review ,1998,39(4):885-905

                        
发表于 2013-1-25 22:26 | 显示全部楼层
请问哪里能找到股票的高频数据呢,谢谢了。
回复 支持 反对

使用道具 举报

关闭

广告上一条 /1 下一条

小黑屋|手机版|南康家具|家具批发|整体橱柜|经济学家 赣ICP备11002034号

GMT+8, 2017-11-18 18:18 , Processed in 0.483720 second(s), 20 queries .

Powered by Discuz! X3.3

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表