9.4 확률적 추세와 확정적 추세
선형 추세를 모델링하는 두 가지 다른 방법이 있습니다. 확정적 추세(deterministic trend)는 다음과 같은 회귀 모델로 얻습니다. \[ y_t = \beta_0 + \beta_1 t + \eta_t, \] 여기에서 \(\eta_t\)는 ARMA 과정입니다. 확률적 추세(stochastic trend)는 다음과 같은 모델로 얻습니다. \[ y_t = \beta_0 + \beta_1 t + \eta_t, \] 여기에서 \(\eta_t\)는 \(d=1\)인 ARIMA 과정입니다. 이 경우에, \(y_t' = \beta_1 + \eta_t'\)가 되도록 양변을 뺍니다. 여기에서 \(\eta_t'\)는 ARMA 과정입니다. 다르게 말하면, \[ y_t = y_{t-1} + \beta_1 + \eta_t'. \] 이것은 표류(drift)가 있는 확률보행(random walk)과 비슷합니다만, 오차항은 단순한 백색잡음(white noise)이 아니라 ARMA 과정입니다.
이러한 모델이 꽤 비슷한 것처럼 보이더라도(\(\eta_t\)에 차분을 계산해야하는 횟수에만 차이가 있습니다), 예측 특성은 꽤 다릅니다.
예측: 호주에 입국하는 국제선 방문객
autoplot(austa) + xlab("연도") +
ylab("백만명") +
ggtitle("호주에 입국하는 전체 연간 국제선 방문객")

Figure 9.9: 매년 호주에 입국하는 국제선 방문객, 1980–2015.
그림 9.9은 1980년부터 2015년까지 매년 호주에 입국하는 국제선 방문객의 전체 수를 나타냅니다. 이러한 데이터를 확정적 추세(deterministic trend) 모델과 확률적 추세(stochastic trend) 모델로 맞출 것입니다.
확정적 추세(deterministic trend) 모델은 다음과 같이 얻습니다.
<- seq_along(austa)
trend <- auto.arima(austa, d=0, xreg=trend))
(fit1 #> Series: austa
#> Regression with ARIMA(2,0,0) errors
#>
#> Coefficients:
#> ar1 ar2 intercept xreg
#> 1.113 -0.380 0.416 0.171
#> s.e. 0.160 0.158 0.190 0.009
#>
#> sigma^2 = 0.0298: log likelihood = 13.6
#> AIC=-17.2 AICc=-15.2 BIC=-9.28
이 모델은 다음과 같이 쓸 수 있습니다. \[\begin{align*} y_t &= 0.416 + 0.171 t + \eta_t \\ \eta_t &= 1.113 \eta_{t-1} -0.380 \eta_{t-2} + \varepsilon_t\\ \varepsilon_t &\sim \text{NID}(0,0.030). \end{align*}\]
추정된 방문하는 사람 수의 증가량은 연간 0.17 백만명입니다.
한편, 확률적 추세(stochastic trend) 모델을 다음과 같이 추정할 수 있습니다.
<- auto.arima(austa, d=1))
(fit2 #> Series: austa
#> ARIMA(0,1,1) with drift
#>
#> Coefficients:
#> ma1 drift
#> 0.301 0.173
#> s.e. 0.165 0.039
#>
#> sigma^2 = 0.0338: log likelihood = 10.62
#> AIC=-15.24 AICc=-14.46 BIC=-10.57
이 모델은 \(y_t-y_{t-1} = 0.173 + \eta'_t\)로 쓸 수 있거나 아래와 같이도 쓸 수 있습니다. \[\begin{align*} y_t &= y_0 + 0.173 t + \eta_t \\ \eta_t &= \eta_{t-1} + 0.301 \varepsilon_{t-1} + \varepsilon_{t}\\ \varepsilon_t &\sim \text{NID}(0,0.034). \end{align*}\]
이 경우에, 추정된 방문하는 사람 수의 증가량은 연간 0.17 백만명입니다. 증가량 추정값이 비슷하더라도 그림 9.10에서 나타나는 것처럼 예측구간은 다르게 나타납니다. 특히, 확률적 추세(stochastic trend)는 오차에 정상성이 나타나지 않기 때문에 예측구간이 훨씬 넓습니다.
<- forecast(fit1,
fc1 xreg = length(austa) + 1:10)
<- forecast(fit2, h=10)
fc2 autoplot(austa) +
autolayer(fc2, series="확률적 추세") +
autolayer(fc1, series="확정적 추세") +
ggtitle("확정적 추세 모델과 확률적 추세 모델에서 얻은 예측값") +
xlab("연도") + ylab("호주 방문객 (백만)") +
guides(colour=guide_legend(title="예측값"))

Figure 9.10: 확정적 추세 모델과 확률적 추세 모델을 사용하여 매년 호주에 입국하는 국제선 방문객을 예측한 것.
확정적 추세(deterministic trend)에는 추세의 기울기가 시간에 따라서 변하지 않을 것이라는 가정이 들어가 있습니다. 반면에, 확률적인 추세(stochastic trend)는 변할 수 있고 추정된 증가량에는 과거 기간 동안 평균 증가만 가정하고, 미래에 나타날 성장률일 필요는 없습니다. 결과적으로, 예측구간이 미래 성장에 있어서 더 큰 불확실성을 허용하기 때문에 확률적 추세(stochastic trend)로 예측하는 것이 더 안전하고, 특별히 예측수평선(forecast horizon)이 좀 더 길 때는 더더욱 그렇습니다.