第 9 章 动态回归模型

在之前章节中,我们仅利用变量的实际观测值进行建模,却没有考虑到随时间的推移而产生的相关信息的影响。例如,假期、竞争对手活动、法律法规变化或其它外部变量影响。若合理利用此类信息修整模型,可以得到预测效果更好的时间序列模型。另一方面,在第5章的回归模型中,模型考虑了大量预测变量的相关信息,但并未采用ARIMA模型处理时间序列中的动态因素。在本章中,我们考虑如何扩展 ARIMA 模型,将一些与预测变量相关的信息纳入模型之中。

在第5章,我们曾建立如下形式的回归模型: \[ y_t = \beta_0 + \beta_1 x_{1,t} + \dots + \beta_k x_{k,t} + \varepsilon_t, \] 其中,\(y_t\)\(k\) 个预测变量(\(x_{1,t},\dots,x_{k,t}\))的线性组合,\(\varepsilon_t\) 是不相关的误差项(例如,误差项为白噪声)。我们可以采用诸如 Breusch-Godfrey 检验之类的检验来评估模型的残差项是否存在显著相关性。

在本章中,我们允许误差项中存在自相关。为了与之前章节的误差项进行区分,我们用 \(\eta_t\) 代替 \(\varepsilon_t\)\(\varepsilon_t\) 表示误差项,且利用 ARIMA 模型拟合残差\(\eta_t\)。例如,若残差\(\eta_t\)满足 ARIMA(1,1,1),则回归模型可写为: \[\begin{align*} y_t &= \beta_0 + \beta_1 x_{1,t} + \dots + \beta_k x_{k,t} + \eta_t,\\ & (1-\phi_1B)(1-B)\eta_t = (1+\theta_1B)\varepsilon_t, \end{align*}\] 其中 \(\varepsilon_t\) 为白噪声。

需要注意的是,模型中存在两个残差项:一是来自回归模型的误差,可用 \(\eta_t\) 表示;二是来自 ARIMA 模型的误差,可用\(\varepsilon_t\) 表示。且假设来自 ARIMA 模型的误差为白噪声。