10.7 演習

  1. この演習は、Huron湖の1875年から1972年までの水位データが入っているLakeHuronデータセットを使います。

    1. as_tsibble()関数を使って、データをtsibbleオブジェクトに変換してください。
    2. Huron湖データに、1920年にノットとARMA誤差構造を持つ区分線形トレンドモデルを適合させてください。
    3. 次の30年の水位を予測してください。外挿した線形トレンドは現実的だと思いますか?
  2. 7.10節の演習4を繰り返しましょう。ただ、今回は残差の自己相関に対処するためARIMA誤差を含めます。

    1. ARIMA誤差過程を含めたことで、回帰係数にどれだけ違いが出ましたか?
    2. ARIMA誤差過程を含めたことで、予測にどれだけ違いが出ましたか?
    3. 当てはめたモデルの残差をチェックして、TSLMモデルで見られた自己相関がARIMA過程によって適切に対処されていることを確認してください。
  3. 日次電力需要の事例を繰り返しましょう。ただ、気温の2次関数を使う替わりに、摂氏25度辺りに「ノット」を持つ区分線形関数を使います。(予測変数TemperatureTemp2を使います。)どうすればノットの選択を最適化できますか?

    以下のようにすると、データを作成できます。

    vic_elec_daily <- vic_elec %>%
      filter(year(Time) == 2014) %>%
      index_by(Date = date(Time)) %>%
      summarise(
        Demand = sum(Demand)/1e3,
        Temperature = max(Temperature),
        Holiday = any(Holiday)) %>%
      mutate(
        Temp2 = I(pmax(Temperature-20,0)),
        Day_Type = case_when(
          Holiday ~ "Holiday",
          wday(Date) %in% 2:6 ~ "Weekday",
          TRUE ~ "Weekend"))
  4. この演習は、オーストラリアの1998年1月から2016年6月までの、宿泊施設の四半期総売上高とホテル、モーテル、ゲストハウスの部屋の占有率水準が入っているaus_accommodationに関するものです。四半期総売上高は百万オーストラリア・ドル単位です。

    1. CPI調整後の売上高を計算し、州ごとに結果をプロットしてください。
    2. 州ごとに、季節ダミー変数、2008 Q1にノットが1つある区分線形時間トレンド、そして、ARIMA誤差を持つ動学的回帰モデルを、CPI調整後の売上高に適合させてください。
    3. モデルの残差がホワイトノイズのように見えるかチェックしてください。
    4. 2017年末までの州ごとの売上高を予測してください。(ヒント: CPIの予測をまず生成する必要があります。)
    5. どのような不確実性の源が区間予測で考慮されていないでしょうか?
  5. 7.10節の演習5では、us_gasoline系列の一部にハーモニック回帰モデルを適合させました。ここでは、このモデルを再訪し、より多くのデータとARMA誤差を含めるように拡張します。

    1. TSLM()を使って、完全な系列に、区分線形時間トレンドを持つハーモニック回帰を適合させてください。トレンドのノットの位置と含むべきフーリエ項の適切な数を、AICc値かCV値を最小化することで選択してください。
    2. さて今度は、誤差の自己相関を許容するARIMA()を使って、TSLM()で使ったのと同じ予測変数を保持しつつ、モデルを再適合させてください。
    3. gg_tsresiduals()関数とLjung-Box検定を使って、最終モデルの残差をチェックしてください。そのまま続けて良いほどホワイトノイズらしく見えますか? そうでないなら、モデルを修正するとか、データの最初の2、3年を除去するとか、試してください。
    4. ホワイトノイズらしい残差を持つモデルが得られたら、翌年の予測を生成してください。
  6. 電力消費を気温の関数としてモデル化することがしばしばあります。気温は日次の暖房温度と冷房温度で測られます。暖房温度は、日次の平均気温が\(18^\circ\)Cよりも低い場合は\(18^\circ\)Cマイナス日次の平均気温、それ以外はゼロ。これで気温低下時の暖房ニーズを測ります。冷房気温は気温上昇時の冷房ニーズを測ります。日次の平均気温が\(18^\circ\)Cよりも高い場合は日次の平均気温マイナス\(18^\circ\)C、それ以外はゼロ、と定義します。\(y_t\)は月次の総電力消費キロワット時を、\(x_{1,t}\)は月次の総暖房気温を、\(x_{2,t}\)は月次の総冷房気温を、それぞれ表すとします。

    分析者が、そうしたデータの1セットに以下のモデルを適合させるとします。 \[y^*_t = \beta_1x^*_{1,t} + \beta_2x^*_{2,t} + \eta_t,\] ただし、 \[(1-\Phi_{1}B^{12} - \Phi_{2}B^{24})(1-B)(1-B^{12})\eta_t = (1+\theta_1 B)\varepsilon_t\] で、\(y^*_t = \log(y_t)\), \(x^*_{1,t} = \sqrt{x_{1,t}}\), \(x^*_{2,t}=\sqrt{x_{2,t}}\)

    1. \(\eta_t\)には、どういう種類のARIMAモデルが特定されていますか?

    2. 係数の推計値は、以下の通りです。

    パラメータ 推計値 標準誤差 \(Z\) \(P\)
    \(\beta_1\) 0.0077 0.0015 4.98 0.000
    \(\beta_2\) 0.0208 0.0023 9.23 0.000
    \(\theta_1\) -0.5830 0.0720 8.10 0.000
    \(\Phi_{1}\) -0.5373 0.0856 -6.27 0.000
    \(\Phi_{2}\) -0.4667 0.0862 -5.41 0.000

    \(\beta_1\)\(\beta_2\)の推計値が電力消費について何を語っているか、説明してください。

    1. より予測に適した表記で方程式を書いてください。
    2. このモデルが次の12カ月の電力消費予測にどのように使えるか、述べてください。
    3. 標準的な回帰パッケージを使ってデータをモデル化するのではなく、\(\eta_t\)項をARIMAモデルでモデル化すべき理由を説明してください。議論の中で、推計値の性質、標準的な回帰結果の有効性、そして、予測を生成する上での\(\eta_t\)モデルの重要性についてコメントしてください。
  7. 以前の章で検討した小売売上高の時系列で、

    1. 季節性にフーリエ項を持つ適切な動学的回帰モデルを開発してください。AICcを使って、モデルに含めるべきフーリエ項の数を選択してください。(以前に特定したのと同じBox-Cox変換をおそらく使う必要があるでしょう。)
    2. 当てはめたモデルの残差をチェックしてください。残差系列はホワイトノイズのように見えますか?
    3. 予測を、他のモデルを使って以前に得ていたものと比べてください。