6.8 분해법으로 예측하기

분해가 주로 시계열 데이터를 연구하거나 시간에 따른 변화를 살펴볼 때 유용하긴 하지만, 예측에도 사용할 수 있습니다.

덧셈 분해를 가정하면, 분해된 시계열을 다음과 같이 쓸 수 있습니다. \[ y_t = \hat{S}_t + \hat{A}_t, \] 여기에서 \(\hat{A}_t = \hat{T}_t+\hat{R}_{t}\)는 계절성으로 조정된 성분입니다. 또는, 곱셈 분해를 사용한다면, 다음과 같이 쓸 수 있습니다. \[ y_t = \hat{S}_t\hat{A}_t, \] 여기에서 \(\hat{A}_t = \hat{T}_t\hat{R}_{t}\)입니다.

분해된 시계열을 예측하기 위해서, 계절성분 \(\hat{S}_t\)과 계절성으로 조정된 성분 \(\hat{A}_t\) 각각을 예측합시다. 계절성분이 변하지 않거나 엄청나게 느리게 변하는 상황을 보통 가정하고, 측정한 성분의 마지막 연도를 이용하여 예측합니다. 다르게 말하면, 계절성분에 나이브 계절성 기법을 사용합니다.

계절성으로 조정된 성분을 예측하기 위해서, 비-계절성 예측 기법을 사용할 수 있습니다. 예를 들면, 표류를 고려하는 확률보행 모델(a random walk with drift model), (다음 장에서 다룰) 홀트(Holt)의 기법, 또는 (8장에서 다룰) 비-계절성 ARIMA 모델을 사용할 수 있습니다.

예제: 전자 장비 제조

fit <- stl(elecequip, t.window=13, s.window="periodic",
  robust=TRUE)
fit %>% seasadj() %>% naive() %>%
  autoplot() + ylab("신규 구매 지수") +
  ggtitle("계절성으로 조정된 데이터의 단순 예측값")
전자 장비 주문 데이터의 STL 분해로부터 얻은 계절성으로 조정된 데이터의 단순 예측값.

Figure 6.14: 전자 장비 주문 데이터의 STL 분해로부터 얻은 계절성으로 조정된 데이터의 단순 예측값.

그림 6.14은 전자 장비 지수 데이터를 계절성으로 조절한 것의 단순(naïve) 예측치를 나타냅니다. 그러면 계절성분의 단순 계절성 예측에 더하여 “재-계절화(reseasonalised)”됩니다.

이렇게 하면 stl 객체에 forecast() 함수를 적용한 것을 다루기 쉽습니다. 계절성으로 조정된 데이터에는 사용할 기법을 입력해야 하고, 그러면 이 함수가 재-계절화를 수행할 것입니다. 그림 6.15은 원본 데이터의 결과 예측치입니다.

fit %>% forecast(method="naive") %>%
  autoplot() + ylab("신규 구매 지수") +
  ggtitle("STL과 확률보행으로 얻은 예측값")
데이터를 STL 분해 후, 계절성으로 조정된 데이터의 단순 예측값과 계절성분의 계절성 단순 예측값에 근거한 전자 장비 구매 데이터 예측값.

Figure 6.15: 데이터를 STL 분해 후, 계절성으로 조정된 데이터의 단순 예측값과 계절성분의 계절성 단순 예측값에 근거한 전자 장비 구매 데이터 예측값.

이 그래프에 나타난 예측구간(prediction interval)은 점 예측치(point forecast)와 같은 방식으로 생성된 것입니다. 즉, 예측구간의 위쪽과 아래쪽 극한은 계절성분의 예측치에 더하여 “재계절화(reseasonalising)”된 것입니다. 이러한 계산 과정에서 계절성분의 예측치의 불확실성은 무시되었습니다. 계절성으로 조정된 데이터에 비해 계절성분의 불확실성이 매우 작다는 사실이 이렇게 선택할 수 있는 근거가 되고, 따라서 불확실성을 무시하여 근사하는 것이 타당합니다.

stlf 함수를 이용하면 좀 더 간단하게 작업할 수 있습니다. 다음의 코드는 STL을 이용하여 시계열을 분해하고, 계절성으로 조정된 시계열을 예측하여, 재계절화된 예측값을 돌려줍니다.

fcast <- stlf(elecequip, method='naive')

stlf() 함수는 분해를 수행하기 위해 mstl()을 사용합니다. 따라서 s.windowt.window의 기본 설정값을 사용합니다.

해당 도움말 파일에 있는 것처럼, 단순 기법을 포함하여 몇 가지 다른 예측 기법도 stlf()에서 사용할 수 있습니다. method를 정하지 않으면, 계절성으로 조정된 시계열에 적용된 (다음 장에서 다룰) ETS 접근법을 사용할 것입니다. 이 과정은 보통 계절성 시계열에 대해 꽤 좋은 예측치를 내고, 몇몇 회사에서는 이것을 모든 내부 운영과정에서 일상적으로 사용합니다.