5.3 当てはめ値と残差

当てはめ値

時系列の各観測値は、それ以前の全ての観測値を使って予測できます。これらを当てはめ値と呼んで、\(y_{1},\dots,y_{t-1}\)の観測値に基づく\(y_t\)の予測という意味で、\(\hat{y}_{t|t-1}\)と表記します。これらを頻繁に利用するので、\(\hat{y}_{t|t-1}\)の添字の一部を省略して単に\(\hat{y}_t\)と書くこともあります。当てはめ値は、本来、1期先予測(13.8節を参照)です。

しかし実際には、当てはめ値が真の意味で予測でないこともしばしばあります。さまざまな予測手法では推計したパラメータを利用しますが、その際、時系列中の将来の観測値を含む、全ての入手可能な観測値を使うためです。例えば、平均法を使う場合、当てはめ値は以下のようになります。 \[ \hat{y}_t = \hat{c} \] ここで、\(\hat{c}\)は、\(t\)時点とそれ以降の観測値を含む、全ての入手可能な観測値から計算された平均です。同様に、ドリフト法では、ドリフト・パラメータは全ての入手可能な観測値を使って推計されます。この場合、当てはめ値は以下のようになります。 \[ \hat{y}_t = y_{t-1} + \hat{c} \] ただし、\(\hat{c} = (y_T-y_1)/(T-1)\)です。どちらの場合でも、観測値から推計するパラメータがあります。\(c\)の上の記号(^)“ハット”は、これが推計値であることを示します。\(c\)の推計値が\(t-1\)時点では入手不可能な観測値を含んで計算されるなら、当てはめ値は真の意味で予測ではありません。一方、ナイーブ予測や季節ナイーブ予測にはパラメータがないので、当てはめ値は真の意味で予測と言えます。

残差

時系列モデルにおける「残差」は、モデルを当てはめた後に残こされたものです。残差は観測値と当てはめ値の差です。 \[ e_{t} = y_{t}-\hat{y}_{t} \]

モデル中で変数の変換が使われていた場合、変換後の尺度で残差を見ることがしばしば有益です。それらをイノベーション残差と呼びます。例えば、データの対数\(w_t = \log(y_t)\)をモデル化したとします。すると、\(w_t - \hat{w}_t\)がイノベーション残差となり、\(y_t - \hat{y}_t\)が通常の残差になります。(予測における変換の使用法については、5.6節を参照) 変換を使っていない場合は、イノベーション残差は通常の残差と同じものになり、その場合、単に「残差」と呼びます。

モデルの当てはめ値と残差はaugment()関数を使って得られます。5.2節のビール生産量の事例では、当てはめたモデルをbeer_fitとして保存していました。ですから、そのオブジェクトにaugment()を適用するだけで、全てのモデルの当てはめ値と残差が計算できます。

augment(beer_fit)
#> # A tsibble: 180 x 6 [1Q]
#> # Key:       .model [3]
#>    .model Quarter  Beer .fitted .resid .innov
#>    <chr>    <qtr> <dbl>   <dbl>  <dbl>  <dbl>
#>  1 平均   1992 Q1   443    436.   6.55   6.55
#>  2 平均   1992 Q2   410    436. -26.4  -26.4 
#>  3 平均   1992 Q3   420    436. -16.4  -16.4 
#>  4 平均   1992 Q4   532    436.  95.6   95.6 
#>  5 平均   1993 Q1   433    436.  -3.45  -3.45
#>  6 平均   1993 Q2   421    436. -15.4  -15.4 
#>  7 平均   1993 Q3   410    436. -26.4  -26.4 
#>  8 平均   1993 Q4   512    436.  75.6   75.6 
#>  9 平均   1994 Q1   449    436.  12.6   12.6 
#> 10 平均   1994 Q2   381    436. -55.4  -55.4 
#> # … with 170 more rows

元のデータに、新しく以下の3列が追加されています。

  • .fittedは当てはめ値、
  • .residは残差、
  • .innovは「イノベーション残差」。このケースでは、通常の残差と同じです。

残差を使って、モデルがデータ中の情報を適切に取り込めたかチェックできます。この目的のためには、イノベーション残差を使います。

イノベーション残差中にパターンが見えるなら、たぶんモデルには改善の余地があります。次節では、残差中のパターンを探索する道具をいくつか見ていきます。