9.6 推計と次数選択

最尤法

モデルの次数(つまりは、\(p\)\(d\)\(q\)の値)を特定したら、次にパラメータ\(c\), \(\phi_1,\dots,\phi_p\), \(\theta_1,\dots,\theta_q\)を推計する必要があります。fableはARIMAモデルを推計する際、最尤法を使います。このテクニックは、観測したデータを得る確率が最大になるパラメータ値を見つけます。ARIMAモデルの場合、最尤法は以下を最小化する最小2乗法と、推計値が似たものになります。 \[ \sum_{t=1}^T\varepsilon_t^2 \] (7章で検討した回帰モデルの場合、最尤法は最小2乗法と全く同じ推計値になります。) ARIMAモデルは回帰モデルより推計がずっと複雑で、ソフトウェアごとに使用する推計方法と最適化アルゴリズムが異なるため、出て来る答えが少しばかり違ってくることに留意してください。

実際には、fableパッケージがデータの対数尤度の値を出力してくれます。対数尤度とは、推計されたモデルから観測値が来ている確率の対数です。\(p\)\(d\)\(q\)を所与として、ARIMA()はパラメータの推計値を見つける際、対数尤度の最大化を試みます。

情報量規準

回帰で予測変数の選択に役立った(7.5節、参照)赤池情報量規準(AIC)は、ARIMAモデルの次数を決めるためにも役立ちます。以下のように書けます。 \[ \text{AIC} = -2 \log(L) + 2(p+q+k+1) \] ただし、\(L\)はデータの尤度、それから、\(c\ne0\)なら\(k=1\)\(c=0\)なら\(k=0\)です。最後の項のかっこ内はモデル内のパラメータの数(残差の分散\(\sigma^2\)を含む)になっていますね。

ARIMAモデルでは、修正AICは以下のように書けます。 \[ \text{AICc} = \text{AIC} + \frac{2(p+q+k+1)(p+q+k+2)}{T-p-q-k-2} \] そして、ベイズ情報量規準は以下のように書けます。 \[ \text{BIC} = \text{AIC} + [\log(T)-2](p+q+k+1) \] AIC、AICc、BICのどれかを最小化することで、良いモデルが得られます。私たちの好みはAICcを使うことです。

これらの情報量規準は、モデルの\(p\)\(q\)の値の選択には役立つものの、適切な差分の次元(\(d\))の選択では良いガイドにはならない傾向があることに注意が必要です。差分を取ると尤度を計算するデータが変わるため、差分の次元が異なるモデル間のAIC値は比較できなくなるためです。ですから、\(d\)の選択には別のアプローチを使う必要があり、その後に、AICcを使って\(p\)\(q\)を選択することになります。