(毕业论文 字数:2556 页数:6)摘要:本文阐述了如何用Griddy-Gibbs抽样对GARCH模型进行贝叶斯推断。Gibbs抽样方法是基于完全条件后验密度的,但在GARCH模型中,参数的密度比较复杂,从而无法用共轭法来构造它的后验密度,对其直接抽样不可行。因此,本文把Gibbs抽样和数值积分法相结合,来从后验分布中进行抽样,并用CUMSUM统计量来判断抽样的收敛性。利用模拟产生的数据,本文分别用Griddy-Gibbs抽样和MLE两种方法来估计模型,并比较其结果,得出结论:这个Griddy-Gibbs抽样是可行的,且结果与MLE互有优劣。
关键词:Griddy-Gibbs抽样,GARCH,CUMSUM统计量,MLE
目录
一、研究背景 二、GARCH模型概述 三、Griddy-Gibbs抽样介绍 四、马尔科夫链收敛性的诊断 五、对GARCH(1, 1)进行Griddy-Gibbs抽样
一、研究背景 GARCH模型的贝叶斯推断已经用一些抽样方法实现过,象importance sampling和Metropolis algorithm,这些方法的缺点在于,它们需要认真挑选一个与后验分布比较近似的候选分布,对它的调整是不可避免的,这就使得这些方法有点机械。 Gibbs抽样充分利用了后验分布的解析性质,当参数向量 被分成单个参数 和 ,且它们的条件后验密度的解析式可知时,Gibbs抽样是非常简单的。依序对各个条件后验密度进行抽样产生一个马尔科夫链,它收敛到对联合后验密度的抽样。在有些情况之下,我们知道 的条件后验密度,但是不知道 的不可知,因此,从 中直接抽样是很方便的,但从 中抽样非常复杂,传统的解决方法是在抽样中利用拒绝算法,如Metropolis-Hastings(MH)算法。 在GARCH模型中,有些参数的完全条件后验密度的形式比较复杂,不能使用传统的抽样方法,本文利用数值积分的方法,把条件后验密度估计出来,然后对其进行抽样,这就是所谓的Griddy-Gibbs抽样。 本文的目的是用Griddy-Gibbs抽样方法对GARCH模型进行贝叶斯推断。在第二部分概述GARCH模型,第三部分介绍Griddy-Gibbs抽样,第四部分介绍收敛性诊断,最后部分我们利用模拟的数据,对GARCH模型进行估计,并与MLE的结果进行比较。
二、 GARCH模型概述 从恩格尔在1982年引进ARCH模型以来,产生了这类应用的许多推广,如GARCH模型融合了参数的节俭原则及条件方差的滞后结构的弹性;假设误差项服从t分布;条件方差的非线性扩展,特别是考虑到条件方差对以往冲击的非对称响应。 本文只考虑对GARCH(1,1)的贝叶斯推断,在其它复杂情形下,抽样方法都一样。GARCH(1,1)模型的形式如下: 如果 是个固定值,则上式是一个正态密度,但是由于 是 , 和 的函数,因而这不是正态的,也不是其它已知的某种分布,从而不可以从中简单直接地进行随机抽样,也不存在共轭分布。 然而, 的核 是以前一次抽得的条件参数为条件的,因而可以用格子点来估计,然后可以用数值积分的方法来求出它的分布函数。接着,我们可以在[0,1]均匀分布上随机抽取一点,通过求分布函数的逆,来抽取 值。对其它参数使用同样的方法进行抽样。下面介绍Griddy-Gibbs抽样的具体步骤。
三、 Griddy-Gibbs抽样介绍 Griddy-Gibbs抽样按照以下步骤进行,从后验密度中抽取N个样本: 第1步:设定参数的起始点,分别为 , 和 第2步:从 开始循环。 第3步:在格子 上计算 ,得到向量 。 第4步:通过G个点格,用数值积分计算 ,其中: , 标准化积分值 ,得到 的分布值。 第5步:在均匀分布U(0,1)上随机抽取一个值 ,在 中找到最靠近 的两个点的位置,用插值法计算出要抽取的 值,标为 ,保存起来。 第6步:用第3到5步的方法来抽取 。 第7步:用第3到点步的方法来抽取 。 第8步:令n=n+1,再回到第3步,直到n>N。 第9步:从 来计算参数的均值和标准差,即为参数的估计。 关于Griddy-Gibbs抽样还存在一些细节的问题,第一,如果要抽取更多的参数,意味着我们要考虑一个更复杂的马尔科夫链,只要如同上面的步骤6和7一样,依次抽取其它参数即可;第二,格子的选择是必须要谨慎,而且这也是应用这个方法的主要难点,研究者必须对参数的积分边界有一个清醒的认识,必须把积分限制在这样一个参数空间里,在这里面后验密度的值要足够大;另外,太大的格子点在实际应用中是不行的,它以抽样的精度为代价。因此,在确定积分区间之前,有必要通过改变条件参数的值来探索一下条件密度的形状;第三,很显然,在每次迭代中改变格子的选取是非常有效的,但这个方法在实际应用中有难度,而不大被采用。
四、马尔科夫链收敛性的诊断 有许多收敛的标准被用到了马尔科夫链上,Gelman和Rubin(1992)年引进一个基于多次抽样的方法,来判断后验结果对初始值是否比较敏感,这个方法不是太吸引人,因为它要进行多次Gibbs抽样。 因此,基于一次抽样的诊断标准要比较好,一个简单的工具是Yu和Mykland(1994)提出的CUMSUM统计量的直观检验,假设我们有马尔科夫链的N个抽样值,CUMSUM统计量的形式如下: , 这里, 和 分别是这N个抽样值的均值和标准差。 如果MCMC是收敛的,则 对t的图形会平缓地收敛到0,相反,如果它长期且规则地偏离0,这表明MCMC的收敛性不存在。 如果研究者想比较各个参数的链的收敛情况,标准化一下这个指标会很方便。t次抽样后的CUMSUM在0.05的水平内,表示经过t次抽样的后验期望对最终(N次抽样)后验期望的偏离在0.05个最终后验标准差估计单位内。通过比较达到0.05水平时的t的大小,可以比较各参数收敛的快慢。 |