8.4 移动平均模型

不同于 使用预测变量的历史值来进行回归,移动平均模型(moving average model)使用历史预测误差来建立一个类似回归的模型。 \[ y_{t} = c + \varepsilon_t + \theta_{1}\varepsilon_{t-1} + \theta_{2}\varepsilon_{t-2} + \dots + \theta_{q}\varepsilon_{t-q}, \] 上式中的 \(\varepsilon_t\) 是白噪声。我们将这个模型称之为MA(\(q\)) 模型,即\(q\)阶移动平均模型。当然,由于我们并不对 \(\varepsilon_t\) 的值进行观测,因此这其实不是一个一般意义上的线性模型。

请注意到 \(y_t\) 的每一个值都可以被认为是一个历史预测误差的加权移动平均值。然而移动平均模型和之前第6节提到的移动平均平滑法有所区别。移动平均模型是用于预测未来值的方法,而移动平均平滑法则是用来估计历史值的循环趋势。

两例不同系数的移动平均模型数据。 左侧是MA(1)模型:$y_t = 20 + \varepsilon_t + 0.8\varepsilon_{t-1}$。右侧是MA(2)模型:$y_t = \varepsilon_t- \varepsilon_{t-1}+0.8\varepsilon_{t-2}$。 两边的$\varepsilon_t$都是均值为零,方差为一的正态分布白噪声。

图 8.6: 两例不同系数的移动平均模型数据。 左侧是MA(1)模型:\(y_t = 20 + \varepsilon_t + 0.8\varepsilon_{t-1}\)。右侧是MA(2)模型:\(y_t = \varepsilon_t- \varepsilon_{t-1}+0.8\varepsilon_{t-2}\)。 两边的\(\varepsilon_t\)都是均值为零,方差为一的正态分布白噪声。

8.6即为 MA(1) 模型和 MA(2) 模型中的数据。如图所示,改变 \(\theta_1,\dots,\theta_q\) 这些系数将会使数据显示出不同的时间序列特征。和自回归模型一样,误差项 \(\varepsilon_t\) 的方差只会改变序列的数值范围,而不会改变它的特征。

任何一个AR(\(p\))模型其实都是可以用一个MA(\(\infty\))模型来表示的。 比如:通过重复的迭代,我们可以用这种方法表示一个AR(1)模型: \[\begin{align*} y_t &= \phi_1y_{t-1} + \varepsilon_t\\ &= \phi_1(\phi_1y_{t-2} + \varepsilon_{t-1}) + \varepsilon_t\\ &= \phi_1^2y_{t-2} + \phi_1 \varepsilon_{t-1} + \varepsilon_t\\ &= \phi_1^3y_{t-3} + \phi_1^2\varepsilon_{t-2} + \phi_1 \varepsilon_{t-1} + \varepsilon_t\\ &\text{etc.} \end{align*}\]

假定中 \(-1 < \phi_1 < 1\)\(\phi_1^k\) 的值会随着 \(k\) 的增大而减小。最终可以得到下式: \[ y_t = \varepsilon_t + \phi_1 \varepsilon_{t-1} + \phi_1^2 \varepsilon_{t-2} + \phi_1^3 \varepsilon_{t-3} + \cdots, \] 这是一个 MA(\(\infty\)) 模型。

如果我们对MA模型的系数加以限制,那么我们也可以反过来用AR模型来表示MA模型。这样的MA模型被称为可逆的(invertible)。也就是说,我们可以将任何一个可逆的MA(\(q\))模型表示为一个AR(\(\infty\))模型。可逆模型不仅仅是让我们足以将任何MA模型转化为AR模型,它们还拥有很多非常棒的数学性质。

比如,考虑MA(1)模型:\(y_{t} = \varepsilon_t + \theta_{1}\varepsilon_{t-1}\),在它的 AR(\(\infty\)) 表示中,当前误差可以被表示为现在和历史观测的线性函数: \[\varepsilon_t = \sum_{j=0}^\infty (-\theta)^j y_{t-j}.\]\(|\theta| > 1\) 时,各个权重将会随着延迟期数增加而增加,因此观测的时段距当前越远,它们对当前误差的影响会越大。当 \(|\theta|=1\) 时,系数将会保持不变,各个观测值的影响相同。由于这些情况都鲜有符合现实的,因此我们通常规定 \(|\theta|<1\) ,这样越近的观测值对当前观测的影响越大。因此,MA模型在 \(|\theta|<1\) 时是可逆的。

其他模型关于可逆性的限制和平稳性的限制类似:

  • 对于MA(1)模型: \(-1<\theta_1<1\)
  • 对于MA(2)模型: \(-1<\theta_2<1,~\) \(\theta_2+\theta_1 >-1,~\) \(\theta_1 -\theta_2 < 1\)

对于 \(q\ge3\) 的其他更复杂的情况,R会在在估计模型时解决这个问题。