9.11 演習

  1. 9.32は、36個、360個、1,000個のランダムな数のACFをそれぞれ示したものです。

    1. これらの図の違いを述べてください。どれもデータがホワイトノイズだと示していますか?
    左: 36個のホワイトノイズ系列のACF、中央: 360個のホワイトノイズ系列のACF、右: 1,000個のホワイトノイズ系列のACF

    図 9.32: 左: 36個のホワイトノイズ系列のACF、中央: 360個のホワイトノイズ系列のACF、右: 1,000個のホワイトノイズ系列のACF

    1. 臨界値の平均ゼロからの距離が各図で異なるのはなぜですか? どれもホワイトノイズだというのに、自己相関が各図で異なるのはなぜですか?
  2. 非定常系列の古典的な例は株価です。Amazon株の日次終値(gafa_stockにあります)を、ACFとPACFともどもプロットしてください。系列が非定常で差分化する必要があることを、各図がどう示しているか述べてください。

  3. 以下の系列で、定常なデータを得るのに必要な、適切なBox-Cox変換と差別化の次数を見つけてください。

    1. global_economyからトルコのGDP
    2. aus_accommodationからTasmania州の宿泊施設売上高(Takings)
    3. souvenirsから月次売上高
  4. 上の演習のsouvenirsデータであなたが選択した差分を、後方シフト演算子の表記を使って書き出してください。

  5. (2.10節の演習8から)あなたの小売売上高データで、定常なデータを得るために(必要なら変換後)適切な差分化の次数を見つけてください。

  6. 単純なARIMAモデルから、いくつかデータをシミュレートしてプロットしてみましょう。

    1. 以下のRコードを使って、\(\phi_{1} = 0.6\)\(\sigma^2=1\)のAR(1)モデルからデータを生成してください。プロセスは\(y_1=0\)から始まります。

      y <- numeric(100)
      e <- rnorm(100)
      for(i in 2:100)
        y[i] <- 0.6*y[i-1] + e[i]
      sim <- tsibble(idx = seq_len(100), y = y, index = idx)
    2. 系列の時間プロットを作成してください。\(\phi_1\)を変えると、プロットはどう変わりますか?

    3. あなた自身でコードを書いて、\(\theta_{1} = 0.6\)\(\sigma^2=1\)のMA(1)モデルからデータを生成してください。

    4. 系列の時間プロットを作成してください。\(\theta_1\)を変えると、プロットはどう変わりますか?

    5. \(\phi_{1} = 0.6\)\(\theta_{1} = 0.6\)\(\sigma^2=1\)のARMA(1,1)モデルからデータを生成してください。

    6. \(\phi_{1} =-0.8\)\(\phi_{2} = 0.3\)\(\sigma^2=1\)のAR(2)モデルからデータを生成してください。(これらのパラメータでは非定常な系列になりますよ。)

    7. 最後の2つの系列をグラフにして比較してください。

  7. aus_airpassengersから、オーストラリアの航空会社の総乗客数(百万人)、1970年から2011年までを考えてみましょう。

    1. ARIMA()を使って、適切なARIMAモデルを見つけてください。どのモデルが選択されましたか? 残差がホワイトノイズらしく見えるかチェックしてください。次の10期間の予測をプロットしてください。
    2. 後方シフト演算子の表記でモデルを書いてください。
    3. ドリフト付きARIMA(0,1,0)モデルからの予測をプロットし、a.と比較してください。
    4. ドリフト付きARIMA(2,1,2)モデルからの予測をプロットし、a.とc.と比較してください。定数を除去して、どうなるか見てください。
    5. 定数のあるARIMA(0,2,1)モデルからの予測をプロットしてください。どうなりましたか?
  8. (global_economyから)米国GDP系列で、

    1. 必要なら、データに適切なBox-Cox変換を見つけ、
    2. ARIMA()を使って、適切なARIMAモデルを変換後のデータに適合させ、
    3. 選択する次数をいろいろ変えて、他のもっともらしいモデルをいくつか試し、
    4. 最良と思うモデルを選んで、残差診断チェックを行ってください。
    5. あなたが当てはめたモデルの予測を生成してください。予測は理にかなったものに見えますか?
    6. 結果を、(変換しないで)ETS()を使って得られたものと比較してください。
  9. aus_arrivalsの数カ国からオーストラリアへの四半期国際訪問客数、1981 Q1 – 2012 Q3を考えてみましょう。

    1. 1カ国選んで、時間プロットを描写してください。
    2. 差分化して、定常なデータを得てください。
    3. 差分データのACFグラフから何が分かりますか?
    4. 差分データのPACFグラフから何が分かりますか?
    5. これらのグラフはどのモデルを示唆していますか?
    6. ARIMA()が選んだモデルは、あなたが選んだものと同じですか? 違うなら、どちらのモデルの方が良いとあなたは思いますか?
    7. モデルを後方シフト演算子の表記で書いて、次に、後方シフト演算子を使わずに書いてください。
  10. us_employmentの米国産業別就業者数から系列を1つ選んでください。

    1. データのSTL分解を作成し、トレンドと季節性を述べてください。
    2. データには変換が必要ですか? そうなら、適切な変換を見つけてください。
    3. データは定常ですか? そうでないなら、定常なデータになるよう適切な差分化を見つけてください。
    4. 時系列を描写するのに役立ちそうなARIMAモデルを2つ、3つ特定してください。AICc値によると、どのモデルが最良ですか?
    5. あなたの最良モデルのパラメータを推計し、残差診断の検定を行ってください。残差はホワイトノイズに似ていますか? そうでないなら、より適合の良い別のARIMAモデルを見つけてみてください。
    6. データの次の3年を予測してください。https://fred.stlouisfed.org/categories/11 から最新値を入手して、あなたの予測の正確性をチェックしてください。
    7. 結局のところ、区間予測があまりに広いので、予測は特段役に立ちません。何年先までの予測なら使用に耐えるほど正確だと、あなたは思いますか?
  11. 季節性時系列である(aus_productionから)オーストラリアの電力、セメント、ガス生産量の中から1つを選んでください。

    1. データには変換が必要ですか? そうなら、適切な変換を見つけてください。
    2. データは定常ですか? そうでないなら、定常なデータになるよう適切な差分化を見つけてください。
    3. 時系列を描写するのに役立ちそうなARIMAモデルを2つ、3つ特定してください。AICc値によると、どのモデルが最良ですか?
    4. あなたの最良モデルのパラメータを推計し、残差診断の検定を行ってください。残差はホワイトノイズに似ていますか? そうでないなら、より適合の良い別のARIMAモデルを見つけてみてください。
    5. あなた好みのモデルを使って、データの次の24カ月を予測してください。
    6. ETS()を使って得た予測と比べてください。
  12. 1つ前の演習であなたが使った同じ時系列で、STLから得た季節調整値に非季節性モデルを使ってみてください。予測を1つ前の演習で得たものと比べてください。どちらが最良のアプローチだと思いますか?

  13. (tourismから)オーストラリアの旅行データで、

    1. 各時系列にARIMAモデルを適合させてください。
    2. あなたが当てはめたモデルの予測を生成してください。
    3. “Snowy Mountains”地域と”Melbourne”地域の予測をチェックしてください。理にかなったものに見えますか?
  14. (上の演習5の)あなたの小売売上高時系列で、

    1. 適切な季節性ARIMAモデルを開発し、
    2. 予測をここまでの章で得たものと比べ、
    3. ABSのウェブサイト (Cat 8501.0, Table 11)から最新の小売売上高データを入手し、あなたの予測を実績値と比べてください。さまざまなモデルからの予測はどれだけ当たっていましたか?
  15. (peltデータセットから)Hudson Bay Companyが1845年から1935年までに商ったカンジキウサギ毛皮数(Hare)を考えてみましょう。

    1. 時系列の時間プロットを作成してください。

    2. 以下のモデルを適合させると決めたとします。 \[ y_t = c + \phi_1 y_{t-1} + \phi_2 y_{t-2} + \phi_3 y_{t-3} + \phi_4 y_{t-4} + \varepsilon_t \] ただし、\(\varepsilon_t\)はホワイトノイズです。これはどんなARIMAモデル(つまり、\(p\)\(d\)\(q\)の値は何)ですか?

    3. データのACFとPACFを検討して、どうしてこのモデルが適切か述べてください。

    4. 系列の最後の5つの値は以下の通りです。

      Year

      1931

      1932

      1933

      1934

      1935

      カンジキウサギ毛皮数

      19520

      82110

      89760

      81660

      15760

      パラメータの推計値は、 \(c = 30993\)\(\phi_1 = 0.82\)\(\phi_2 = -0.29\)\(\phi_3 = -0.01\)\(\phi_4 = -0.22\)forecast()関数を使わずに、次の3年(1936–1939)の予測を計算してください。

    5. では、Rでモデルを適合させ、forecast()を使って予測を得てください。あなたの計算とどう違っていますか? なぜですか?

  16. global_economyデータセットに1960年から2017年までのスイスの人口があります。

    1. データの時間プロットを作成してください。

    2. 以下のモデルを系列に適合させると決めたとします。 \[y_t = c + y_{t-1} + \phi_1 (y_{t-1} - y_{t-2}) + \phi_2 (y_{t-2} - y_{t-3}) + \phi_3( y_{t-3} - y_{t-4}) + \varepsilon_t\] ただし、\(y_t\)\(t\)年の人口で、\(\varepsilon_t\)はホワイトノイズです。 これはどんなARIMAモデル(つまり、\(p\)\(d\)\(q\)の値は何)ですか?

    3. 差分系列のACFとPACFを使って、どうしてこのモデルを選んだか述べてください。

    4. 系列の最後の5つの値は以下の通りです。

      Year

      2013

      2014

      2015

      2016

      2017

      人口 (百万人)

      8.09

      8.19

      8.28

      8.37

      8.47

      パラメータの推計値は、 \(c = 0.0053\)\(\phi_1 = 1.64\)\(\phi_2 = -1.17\)\(\phi_3 = 0.45\)forecast()関数を使わずに、次の3年(2018–2020)の予測を計算してください。

    5. 今度は、Rでモデルを適合させ、同じモデルから予測を得てください。あなたの計算とどう違っていますか? なぜですか?

  1. この演習の前に、以下のようにしてRにQuandlパッケージをインストールする必要があります。

    install.packages("Quandl")
    1. Quandl から時系列を1つ選んでください。次に、その短縮URLをコピーし、以下のようにしてデータをインポートしてください。

      y <- as_tsibble(Quandl::Quandl("?????"), index = Date)

      (?????は適切なコードに入れ替えてください。)

    2. データのグラフを描き、適切なARIMAモデルの特定を試みてください。

    3. あなたのARIMAモデルの残差診断チェックを行ってください。残差はホワイトノイズでしょうか?

    4. あなたが選んだARIMAモデルを使って、次の4年を予測してください。

    5. 今度は、適切なETSモデルを特定してみてください。

    6. あなたのETSモデルの残差診断チェックを行ってください。残差はホワイトノイズでしょうか?

    7. あなたが選んだETSモデルを使って、次の4年を予測してください。

    8. 2つのモデルのうち、どちらが好みですか?