Chapter 9 동적 회귀 모델

이전 두 장에서의 시계열 모델에는 시계열의 이전 관측값으로부터 얻은 정보는 들어가지만 관련 있을 수 있는 다른 정보가 들어가지는 않습니다. 예를 들면, 휴일 효과, 경쟁자 활동, 관련 법 변경, 시장 확대, 또는 몇몇 과거 변동을 설명할 수 있는 다른 외부 변수가 더 정확한 예측값으로 이어질 수 있습니다. 반면에, 5 장의 회귀 모델은 예측변수(predictor variable)의 수많은 관련 정보를 포함하도록 합니다만, ARIMA 모델로 다룰 수 있는 미묘한 시계열 동역학을 다루긴 힘듭니다. 이 장에서는 모델에 넣을 다른 정보를 넣기 위해 ARIMA 모델을 어떻게 확장할지 다루겠습니다.

5 장에서 다음과 같은 형태의 회귀 모델을 다루었습니다. \[ y_t = \beta_0 + \beta_1 x_{1,t} + \dots + \beta_k x_{k,t} + e_t, \] 여기에서 \(y_t\)\(k\) 예측변수(predictor variable)(\(x_{1,t},\dots,x_{k,t}\))의 선형 함수이고, \(\varepsilon_t\)는 보통 상관관계가 없는 오차항으로 가정합니다(즉, 백색잡음(white noise)). 결과 잔차에 유의미한 상관관계가 있는지 판단하기 위해 브로이쉬-갓프레이(Breusch-Godfrey) 검정 같은 통계 검정을 고려하였습니다.

이 장에서는, 자기상관을 넣기 위해 회귀에 오차항을 넣을 것입니다. 이러한 큰 변화를 강조하기 위해, 식에서 \(\varepsilon_t\)\(\eta_t\)로 바꿀 것입니다. 오차 시계열 \(\eta_t\)는 ARIMA 모델을 따른다고 가정합니다. 예를 들어, \(\eta_t\)가 ARIMA(1,1,1) 모델을 따르면, 다음과 같이 쓸 수 있습니다. \[\begin{align*} y_t &= \beta_0 + \beta_1 x_{1,t} + \dots + \beta_k x_{k,t} + n_t,\\ & (1-\phi_1B)(1-B)n_t = (1+\theta_1B)e_t, \end{align*}\] 여기에서 \(\varepsilon_t\)는 백색잡음 시계열입니다.

모델에 두 오차항, \(\eta_t\)로 쓰는 회귀 모델로부터 온 오차, \(\varepsilon_t\)로 쓰는 ARIMA 모델로부터 온 오차가 있는 것에 주목하시길 바랍니다. ARIMA 모델 오차만 백색잡음으로 가정합니다.