7.7 ETS 모델로 예측하기

\(t=T+1,\dots,T+h\)에 대한 식을 가지고 반복하고 \(t>T\)에 대해 모두 \(\varepsilon_t=0\)로 둬서 점 예측값을 얻습니다.

예를 들면, ETS(M,A,N) 모델에 대해, \(y_{T+1} = (\ell_T + b_T )(1+ \varepsilon_{T+1})\)입니다. 따라서 \(\hat{y}_{T+1|T}=\ell_{T}+b_{T}\)입니다. 비슷하게, \[\begin{align*} y_{T+2} &= (\ell_{T+1} + b_{T+1})(1 + \varepsilon_{T+1})\\ &= \left[ (\ell_T + b_T) (1+ \alpha\varepsilon_{T+1}) + b_T + \beta (\ell_T + b_T)\varepsilon_{T+1} \right] ( 1 + \varepsilon_{T+1}) \end{align*}\] 입니다. 따라서, \(\hat{y}_{T+2|T}= \ell_{T}+2b_{T}\) 입니다. 이러한 예측값은 홀트(Holt)의 선형 기법으로 얻은 예측값과 같고, ETS(A,A,N) 모델로 얻은 것과 같습니다. 따라서, 이 기법으로 얻은 것과 이 기법을 이루는 두 모델로 얻은 예측값은 (같은 매개변수 값을 사용했다고 가정하면) 같습니다.

ETS 점 예측값은 예측 분포의 중간값(median)과 같습니다. 덧셈 성분만 이용하는 모델의 경우에는, 예측 분포가 정규 분포라서, 평균과 중앙값이 같습니다. 곱셈 오차를 이용하는 ETS 모델의 경우나 곱셈 계절성을 이용하는 경우에는, 점 예측값은 예측분포의 평균값과 같지 않을 것입니다.

ETS 모델에서 예측값을 얻기 위해, forecast() 함수를 사용합니다.

fit %>% forecast(h=8) %>%
  autoplot() +
  ylab("호주 국제선 여행객 숙박일 수 (단위: 백만)") +
  ggtitle("ETS(M,A,M)으로 얻은 예측값")
ETS(M,A,M) 모델을 사용하여 호주를 방문하는 국제선 여행객 숙박일 수를 예측한 것.

Figure 7.11: ETS(M,A,M) 모델을 사용하여 호주를 방문하는 국제선 여행객 숙박일 수를 예측한 것.

예측구간

예측구간(prediction interval)도 생성할 수 있다는 것은 지금까지 다룬 모델의 커다란 장점입니다. 몇몇 모델은 이러한 방법으로 얻을 수 없습니다. 예측구간은 덧셈 기법과 곱셈 기법에서 다르게 나타납니다.

대부분의 ETS 모델에 대해, 예측구간은 다음과 같이 쓸 수 있습니다. \[ \hat{y}_{T+h|T} \pm k \sigma_h \] 여기에서 \(k\)는 포함확률(coverage probability)에 따라 달라지고, \(\sigma_h\)는 예측 분산입니다. \(k\)의 값은 표 3.1에 주어져 있습니다. ETS 모델에서 \(\sigma_h\)에 대한 식은 복잡할 수 있습니다. 자세한 내용은 Hyndman et al. (2008) 의 6장에 있습니다. 표 7.8에는, 그 중에서 가장 단순한 식인 덧셈 ETS 에 대한 식이 있습니다.

Table 7.8: 각각의 덧셈 상태 공간 모델에 대한 예측 분산 식, 여기에서 \(\sigma^2\)는 잔차 분산, \(m\)은 계절성 주기, \(k\)\((h-1)/m\)의 정수 부분 (즉, 시간 \(T+h\) 앞 예측 기간에서 연도의 개수).
모델 예측 분산: \(\sigma_h^2\)
(A,N,N) \(\sigma_h^2 = \sigma^2\big[1 + \alpha^2(h-1)\big]\)
(A,A,N) \(\sigma_h^2 = \sigma^2\Big[1 + (h-1)\big\{\alpha^2 + \alpha\beta h + \frac16\beta^2h(2h-1)\big\}\Big]\)
(A,A\(_d\),N) \(\sigma_h^2 = \sigma^2\biggl[1 + \alpha^2(h-1) + \frac{\beta\phi h}{(1-\phi)^2} \left\{2\alpha(1-\phi) +\beta\phi\right\}\)
                    \(\mbox{} - \frac{\beta\phi(1-\phi^h)}{(1-\phi)^2(1-\phi^2)} \left\{ 2\alpha(1-\phi^2)+ \beta\phi(1+2\phi-\phi^h)\right\}\biggr]\)
(A,N,A) \(\sigma_h^2 = \sigma^2\Big[1 + \alpha^2(h-1) + \gamma k(2\alpha+\gamma)\Big]\)
(A,A,A) \(\sigma_h^2 = \sigma^2\Big[1 + (h-1)\big\{\alpha^2 + \alpha\beta h + \frac16\beta^2h(2h-1)\big\}\)
                    \(\mbox{} + \gamma k \big\{2\alpha+ \gamma + \beta m (k+1)\big\} \Big]\)
(A,A\(_d\),A) \(\sigma_h^2 = \sigma^2\biggl[1 + \alpha^2(h-1) + \gamma k(2\alpha+\gamma)\)
                    \(\mbox{} +\frac{\beta\phi h}{(1-\phi)^2} \left\{2\alpha(1-\phi) + \beta\phi \right\}\)
                    \(\mbox{} - \frac{\beta\phi(1-\phi^h)}{(1-\phi)^2(1-\phi^2)} \left\{ 2\alpha(1-\phi^2)+ \beta\phi(1+2\phi-\phi^h)\right\}\)
                    \(\mbox{} + \frac{2\beta\gamma\phi}{(1-\phi)(1-\phi^m)}\left\{k(1-\phi^m) - \phi^m(1-\phi^{mk})\right\}\biggr]\)

몇 가지 ETS 모델에서, 예측 구간에 대한 식이 알려져 있지 않습니다. 이러한 경우에는, forecast() 함수가 모사한 미래 표본 경로(future sample path)를 사용하고, 모사한 미래 경로의 백분위수(percentile)에서 예측 구간을 계산합니다.

forecast() 사용하기

아래의 R 코드는 ETS 모델을 적용했을 때, 이 함수가 지원하는 가능한 입력값을 나타냅니다. 아래에서 입력값 각각을 설명하겠습니다.

forecast(object, h=ifelse(object$m>1, 2*object$m, 10),
level=c(80,95), fan=FALSE, simulate=FALSE, bootstrap=FALSE,
npaths=5000, PI=TRUE, lambda=object$lambda, biasadj=NULL, ...)
object
ets() 함수가 돌려주는 객체.
h
예측 범위 — 예측할 기간의 개수.
level
예측구간에 대한 신뢰 수준.
fan
만약에 fan=TRUE이면, level=seq(50,99,by=1)입니다. 부채 그래프(fan plot 또는 fan chart)의 경우에 알맞습니다.
simulate
만약에 simulate=TRUE이면, 대수적인 식을 사용하는 대신에, 모사하여 예측 구간을 돌려줍니다. simulate=FALSE이더라도, 특정 모델에 대해 사용할 수 있는 대수적인 식이 없는 경우라면, 모사를 할 것입니다.
bootstrap
만약에 bootstrap=TRUE이고 simulate=TRUE이면, 정규 분포를 이루는 오차 대신, 모사한 예측 구간에서 다시 뽑아서 만든 오차를 사용합니다.
npaths
모사 예측 구간을 계산할 때 사용하는 표본 경로의 수.
PI
만약에 PI=TRUE이면, 예측 구간을 그립니다; 그렇지 않은 경우에는 점 예측치만 계산합니다.
lambda
박스-칵스(Box-Cox) 변환 매개변수. 만약에 lambda=NULL이면, 이 항목이 무시됩니다. 그렇지 않은 경우에는, 예측값이 역 박스-칵스(Box-Cox) 변환을 통해 역 변환됩니다.
biasadj
만약에 lambdaNULL이 아니면, 역 변환된 예측값이 (그리고 예측 구간이) 편향에 대해 조정됩니다.

참고 문헌

Hyndman, R. J., Koehler, A. B., Ord, J. K., & Snyder, R. D. (2008). Forecasting with exponential smoothing: The state space approach. Berlin: Springer-Verlag. http://www.exponentialsmoothing.net