11.6 オーストラリア囚人数の予測

オーストラリア囚人数データ(11.1節)に戻って、基礎となるETSモデルにボトムアップとMinTの手法を適用して得た予測を、利用可能なデータの最後の2年間2015Q1–2016Q4の8四半期をテストセットに使って、比較しましょう。

fit <- prison_gts %>%
  filter(year(Quarter) <= 2014) %>%
  model(base = ETS(Count)) %>%
  reconcile(
    bottom_up = bottom_up(base),
    MinT = min_trace(base, method = "mint_shrink")
  )
fc <- fit %>% forecast(h = 8)
fc %>%
  filter(is_aggregated(State), is_aggregated(Gender),
         is_aggregated(Legal)) %>%
  autoplot(prison_gts, alpha = 0.7, level = 90) +
  labs(y = "囚人数 (千人)", level = "区間予測",
       title = "オーストラリア囚人数 (総数)")
オーストラリア四半期成人囚人数の2015Q1--2016Q4予測

図 11.14: オーストラリア四半期成人囚人数の2015Q1–2016Q4予測

11.14は、集計したオーストラリア囚人数の予測3式です。ETSモデルからの基礎予測(base)とボトムアップ予測(bottom-up)はテスト期間のトレンドを過小評価しているようです。MinTアプローチは集計構造の全ての基礎予測からの情報を組み合わせており、このケースでは、トップレベルの基礎予測を上方修正しています。

MinTは分散最小化の推計法に基づいているので、MinT和解の区間予測は基礎予測よりもずっと狭くなっています。基礎予測の分布はまた一貫性がなく、従って一貫性の欠如という過ちから追加される不確実性を抱えています。

可視化による探索を簡単にするため、残りのプロットではボトムアップ予測を省きます。ただし、後に提示する評価結果で正確性を見る際は、含めることにします。

11.15–図11.17は、集計のさまざまなレベルでのMinTと基礎予測(base)です。影響を見やすくするため、訓練データは最後の5年分だけを示しています。一般的に、MinTは基礎予測をテストセットの方向へ修正しており、その結果、予測の正確性が改善しています。全ての系列でMinT和解予測が基礎予測よりも正確になる保証はありませんが、平均としてはより正確になります。 (Panagiotelis et al., 2021 を参照).

fc %>%
  filter(
    .model %in% c("base", "MinT"),
    !is_aggregated(State), is_aggregated(Legal),
    is_aggregated(Gender)
  ) %>%
  autoplot(
    prison_gts %>% filter(year(Quarter) >= 2010),
    alpha = 0.7, level = 90
  ) +
  labs(title = "囚人数 (州別)", level = "区間予測",
       y = "囚人数 (千人)") +
  facet_wrap(vars(State), scales = "free_y", ncol = 4) +
  theme(axis.text.x = element_text(angle = 90, hjust = 1))
オーストラリア四半期成人囚人数の州別予測

図 11.15: オーストラリア四半期成人囚人数の州別予測

11.15は、8州それぞれの予測です。全ての州にわたってテストセット期間には総じて上昇トレンドがあります。しかし、New South WalesとTasmaniaにはひときわ大きい突然の急増があるようで、これら両州ではテストセットの観測値が区間予測の上限を軽く超えてしまっています。囚人数が最も多い州がNew South Walesなので、この急増は総計にかなりの影響を与えています。対照的に、Victoriaでは、2015Q2–2015Q3にかなりの急減があり、そこから上昇トレンドに戻っています。この急減を捉えたVictoriaの予測は1つもありません。

オーストラリア四半期成人囚人数の法的身分別、性別予測

図 11.16: オーストラリア四半期成人囚人数の法的身分別、性別予測

オーストラリア四半期成人囚人数のボトムレベル系列の予測、つまり州別かつ法的身分別かつ性別予測

図 11.17: オーストラリア四半期成人囚人数のボトムレベル系列の予測、つまり州別かつ法的身分別かつ性別予測

11.17は、オーストラリア囚人数のボトムレベル系列のいくつかの予測です。4つの列は大きい方から4つの州で、4つの行は法的身分と性の組み合わせです。ここから、政策を示唆するいくつかの分析と観察が見えてきます。2015Q1–2016Q4のテスト期間に全ての州にわたって観測された大きな増加は、未決囚の大きな増加によるものに見えます。これらの増加を両予測は総じて見逃しているようです。他の州と対照的に、New South Walesでは既決囚も相当増加しています。特に、男性既決囚の増加が州、および、全国の囚人数増加に相当貢献しています。

accuracy()関数を使って、グループ化構造にわたって予測の正確性を評価しましょう。以下のコードでは、オーストラリア囚人数時系列のトップレベルの全国計だけの予測正確性を評価しています。似たコードを使って残りも評価した結果が表11.3です。

fc %>%
  filter(is_aggregated(State), is_aggregated(Gender),
         is_aggregated(Legal)) %>%
  accuracy(data = prison_gts,
           measures = list(mase = MASE,
                           ss = skill_score(CRPS)
                           )
           ) %>%
  group_by(.model) %>%
  summarise(mase = mean(mase), sspc = mean(ss) * 100)
#> # A tibble: 3 × 3
#>   .model     mase  sspc
#>   <chr>     <dbl> <dbl>
#> 1 base      1.72   55.9
#> 2 bottom_up 1.84   33.5
#> 3 MinT      0.895  76.8

11.3は、グループ化集計構造の各レベルを含む全てのレベルにわたって2015Q1–2016Q4のテスト期間での、基礎予測、ボトムアップ予測、MinT和解予測の正確性を要約したものです。

表 11.3: オーストラリア囚人数の異なる系列グループごとの予測の正確性
MASE
CRPSスキルスコア
Base Bottom-up MinT Base Bottom-up MinT
総計 1.72 1.84 0.90 55.91 33.46 76.80
州別集計 2.12 1.88 1.78 6.40 24.10 22.46
法的身分別集計 2.89 2.68 2.32 22.22 50.27 45.23
性別集計 0.89 1.76 0.91 68.98 27.49 71.06
ボトム 2.23 2.23 2.06 0.93 0.93 -3.23
全系列 2.19 2.16 1.96 6.70 11.29 8.69

グループごとに囚人数が相当違うので、尺度に依存しない指標を使っています。MASEは点予測の尺度に依存しない正確性指標(5.8節、参照)で、CRPSスキルスコアは予測の分布の尺度に依存しない正確性指標(5.9節、参照)です。MASEは小さいと良い予測を指し、CRPSスキルスコアは大きいと良い予測を指します。

MinT和解予測は基礎予測から正確性を改善していて、しかもボトムアップ予測よりも正確、という結果になりました。MinT最適和解のアプローチは構造の全てのレベルからの情報を使うので、限られた情報しか使わない(ボトムアップのような)伝統的アプローチよりも正確な予測を生成するのです。

参考文献

Panagiotelis, A., Athanasopoulos, G., Gamakumara, P., & Hyndman, R. J. (2021). Forecast reconciliation: A geometric view with new insights on bias correction. International Journal of Forecasting, 37(1), 343–359. [DOI]