8.6 估计和阶数选择

极大似然估计

一旦我们确定了模型的阶数(即 \(p\)\(d\)\(q\) 的取值),我们就需要估计参数 \(c\)\(\phi_1,\dots,\phi_p\)\(\theta_1,\dots,\theta_q\)了。 在R估计ARIMA模型时,它会采用极大似然估计(maximum likelihood estimation)。该方法通过最大化我们观测到的数据出现的概率来确定参数。对于ARIMA模型而言,极大似然估计和最小二乘估计非常类似,最小二乘估计是通过最小化方差而实现的: \[ \sum_{t=1}^T\varepsilon_t^2. \] (对于我们在第5章中讨论的回归模型而言,极大似然估计和最小二乘估计的参数估计结果相同。)这里需要注意的是,ARIMA模型相较于回归模型更为复杂,因此不同的软件在使用不同估计方法和优化算法时会出现略微不同的结果。

在现实应用中, R将会显示数据的对数似然函数的值;它指的是模型中观测数据出现的概率的对数。在给定 \(p\)\(d\)\(q\)时,R将会通过最大化对数似然函数来估计参数。

信息准则

AIC信息准则(Akaike Information Criterion)在选择用于回归模型的变量时非常有用, 同样在确定ARIMA模型阶数时也可以发挥很大作用。它可以写作: \[ \text{AIC} = -2 \log(L) + 2(p+q+k+1), \] 这里的 \(L\) 是数据的似然函数,当 \(c\ne0\)\(k=1\) 且当 \(c=0\)\(k=0\)。需要注意到是式子中的最后一项是模型中参数的个数(包括残差方差\(\sigma^2\))。

对于ARIMA模型而言,修正过的AIC值可以被表示为: \[ \text{AICc} = \text{AIC} + \frac{2(p+q+k+1)(p+q+k+2)}{T-p-q-k-2}, \] BIC信息准则(Bayesian Information Criterion)的表示方式如下: \[ \text{BIC} = \text{AIC} + [\log(T)-2](p+q+k+1). \] 通过最小化AIC,AICc或者BIC我们都可以得到最优模型。其中我们倾向于使用AICc。

有一点需要格外注意:这些信息准则在选择模型的合适的差分阶数(\(d\))时效果并不好,只能被用于选择 \(p\)\(q\) 的取值。这是因为差分改变了似然函数计算所使用数据,这会使得不同差分阶数的模型的AIC值无法比较。因此我们需要用其他方法先选择出合适的 \(d\),然后再通过 AICc 来选择\(p\)\(q\)的取值。