时间序列分析的大致框架:
这篇文章的重点放在非平稳时间序列的建模上。
ARIMA
若非平稳序列经过差分后能显示出平稳序列的性质,我们就可以称这个非平稳序列为差分平稳序列,而ARIMA模型拟合就相当于给差分平稳序列使用ARMA模型进行拟合。
一般情况下ARIMA模型记为ARIMA(p,d,q),其中p、d、q分别为ARMA模型的阶数,d为差分阶数,d=0时,ARIMA模型就是ARMA模型:
⎩⎪⎨⎪⎧Φ(B)∇dxt=Θ(B)εtE(εi)=0,Var(εi)=σε2,E(εiεx)=0,s=tExsεt=0,∀s<t
式中, ∇d=(1−B)d;Φ(B)=1−ϕ1B−⋯−ϕβBp, 为平稳可逆 ARMA(p,q) 模型的自 回归系数多项式; Θ(B)=1−θ1B−⋯−θnBq, 为平稳可逆 ARMA(p,q) 模型的移动平滑系数多项式。
前边图中也有写到,非平稳序列的确定性因素可以分解为S、T、C、I四个部分,如果四部分是加法关系,那么差分运算就可以将所有的效应都直接提取出来,例如,可以先进行周期步长的差分消除季节信息,再通过一阶差分等消除趋势效应,进而得到一个平稳的序列,然后使用ARMA模型拟合,这种情况下的模型是一个类似下边结构的模型:
∇d∇Dxt=Φ(B)εtΘ(B)
式中,
(1) D 为周期步长, d 为提取趋势信息所用的差分阶数。
(2) {εi} 为白噪声序列, 且 E(εi)=0,Var(εt)=σe2 。
(3) Θ(B)=1−θ1B−⋯−θqBq, 为 q 阶移动平均系数多项式。
(4) Φ(B)=1−ϕ1B−⋯−ϕpBp, 为 p 阶自回归系数多项式。
当然,这种差分方法的前提是所有的效应是通过加法关系建立的,这也是所谓的“简单季节模型”,或者说随机季节模型。
如果发现差分之后序列不能用ARMA模型得到很好的拟合效果,很有可能就是因为序列的季节效应和短期的相关性还存在复杂的关联性,这个时候就需要尝试使用乘积模型来进行拟合:
假设这里存在一个季节效应与随机效应存在相关性的非平稳序列{xt},首先该序列经过D阶季节差分之后变成了一个差分平稳序列,首先借助ARMA(P,Q)模型扣除季节效应有:
ΦS(B)(∇SDxt)=ΘS(B)εt
其中有:
\begin{align*}
& \Theta_S(B)=1-\theta_1 B^S-\cdots-\theta_Q B^{Q S} \\
& \Phi_S(B)=1-\phi_1 B^S-\cdots-\phi_P B^{P S}
\end{align*}
注意因为这里是对季节差分后的序列做ARMA模型拟合,所以延迟阶数是周期S的倍数。这时将ΘS(B)εt用et表示,ΦS(B)(∇SDxt)用ωt表示,那么就可以得到一个扣除了季节效应以外的新序列,而et则是原序列中季节效应以外其他效应的叠加,这个时候为了提取出趋势的影响,需要对新的{ωt}序列进行一个ARIMA(p,d,q)拟合:
\begin{align*}
&\nabla^d\omega_t=\frac{\Theta(B)}{\Phi(B) } e_t\\
\text { 式中, } & \Theta(B)=1-\theta_1 B-\cdots-\theta_q B^q \\
& \Phi(B)=1-\phi_1 B-\cdots-\phi_p B^p \\
\end{align*}
将两次拟合的模型写在一起就得到了乘积季节模型,注意求差分运算可以写成∇SD=(1−BS)D,因此∇的位置也可以进行一定的调整:
式中, ∇d∇SDxt=Φ(B)ΦS(B)Θ(B)Θs(B)εtΘ(B)=1−θ1B−⋯−θqBqΦ(B)=1−ϕ1B−⋯−ϕpBpΘS(B)=1−θ1BS−⋯−θQBQSΦS(B)=1−ϕ1BS−⋯−ϕPBPS
该乘积模型简记为 ARIMA(p,d,q)×(P,D,Q)S 。
残差自回归
ARIMA模型对提取模型中的趋势效应和季节效应有很好的效果,但却不能保证完全提取出序列的信息,若模型拟合的残差存在一定的相关性,这个时候需要对残差序列做一个拟合自回归,来进一步提取趋势效应或者季节效应。
条件异方差模型
宏观经济领域的研究过程中通常发现某些序列拟合后的残差列波动在大部分时段是平稳的,但是在某些时段波动会表现出持续偏大或者偏小的情况(集群效应)。这时说明残差序列出现了异方差性。
对于资产持有者来说,我们往往希望只关心持有资产的这段时间内收益率会不会有大的波动,那么基于序列全程的方差齐性就不能满足要求,因此就产生了对残差序列短时间内波动方差的研究,因为更多情况下是基于历史的短期波动来预测当期波动,因此以这种方式建立的模型叫做条件异方差模型。
关于异方差性问题的存在会导致的影响这里再给出进一步的解释:经典的ARIMA模型做预测是建立在残差序列方差齐性的假设之下的,而残差序列的异方差性的存在使得ARIMA模型对预测值的区间估计带来影响(残差方差会影响到标准误)
ARCH模型
ARCH模型的实质是将历史波动信息作为条件,并采用某种自回归形式来刻画波动的变化,条件方差的来源:
Var(εt∣εt−1,εt−2,⋯)=E(εi2∣εt−1,εs−2,⋯)=ω+j=1∑qλjεi−j2
完整结构:
⎩⎪⎨⎪⎧xi=f(t,xj−1,xj−2,⋯)+εiεi=hieihi=ω+∑j=1qλεi−j2
式中, f(t,xt−1,xt−2,⋯) 为 {xt} 的确定性信息拟合模型, ei∼N(0,σ2)
ARCH模型的实质是将历史波动信息作为条件,并采用某种自回归形式来刻画波动的变化。对于一个时间序列而言,在不同的时刻包含的历史信息不同,因而相应的条件方差也不同。利用ARCH模型,可以刻画出随时间变化而变化的条件方差。
ARCH模型的实质是使用残差平方序列的q阶移动平均拟合当期异方差函数值。由于移动平均模型具有自相关系数阶截尾性,所以ARCH模型实际上只适用于异方差函数短期自相关过程。
GARCH
ARCH模型的几点问题:
- ARCH模型在预测具有长期相关的残差序列阶数过高,鸡儿导致估计的参数估计难度加大
- 残差序列的方差必须大于0,因此ARCH模型对参数的限制会比较强。
为了修正这个问题,Bollerslov在1985年提出了广义自回归条件异方差(Generalized Autoregressive Conditional Heteroskedastic)模型,它的结构如下:
⎩⎪⎨⎪⎧xi=f(t,xi−1,xt−2,⋯)+εtεi=hieiht=ω+∑i=1pηiht−i+∑i=1qλiεi2;
其中{et}为白噪声序列
在原模型的基础上,考虑了异方差函数的p阶自相关性而形成的。