9.1 추정

모델에서 매개변수를 추정할 때, \(\varepsilon_t\) 값을 제곱한 것의 합을 최소화할 필요가 있습니다. \(\varepsilon_t\) 값 대신에 \(\eta_t\) 값을 제곱한 것의 합을 최소화하면(오차에 있는 자기상관을 무시하는 회귀 모델을 추정할 때 일어날 수 있는), 몇 가지 문제가 생깁니다.

  1. 몇 가지 정보가 계산에서 무시되기 때문에, 추정된 계수 \(\hat{\beta}_0,\dots,\hat{\beta}_k\)이 더이상 가장 좋은 추정값이 아닙니다.
  2. 모델과 관련된 어떠한 통계 검정이(즉, 계수에 대한 t-검정) 부정확해질 것입니다.
  3. 적합 모델(fitted model)의 AICc 값이 더이상 가장 좋은 예측 모델을 판단하는 좋은 안내자가 되지 않습니다.
  4. 대부분의 경우에서, 계수와 관련된 \(p\)-값이 너무 작을 것이고, 몇몇 예측변수(predictor variable)가 실제로는 그렇지 않지만 중요한 것처럼 나타날 것입니다. 이것은 “허위 회귀(spurious regression)”라고 알려져 있습니다.

\(\varepsilon_t\) 값을 제곱한 것의 합을 최소화하는 것으로 이러한 문제를 방지합니다. 대신에, 최대 가능도 추정(MLE)을 사용할 수 있습니다. 이 방법은 비슷한 계수 추정값을 낼 것입니다.

ARMA 오차를 가지고 회귀를 추정할 때 중요하게 생각해야하는 것은 다음과 같습니다. 모델의 모든 변수는 먼저 정상성(stationarity)을 나타내야합니다. 따라서, 먼저 \(y_t\)와 모든 예측변수(predictor variable) \((x_{1,t},\dots,x_{k,t})\)가 정상성(stationarity)을 나타내는지 살펴보아야 합니다. 이러한 것 중에서 하나라도 정상성을 나타내지 않을 때 모델을 추정하면, 추정된 계수가 일관적이지 않을 것입니다(따라서 의미가 없을 수도 있습니다). 정상성을 나타내지 않는 변수가 서로 결합되어있는 경우는 예외가 됩니다. 정상성을 나타내지 않는 \(y_t\)와 예측변수(predictor variable)의 선형 결합이 정상성을 나타낼 때, 추정된 계수가 일관적일 것입니다.19

따라서 모델에서 정상성을 나타내지 않는 변수의 1차 차분을 구합니다. 종종 \(y_t\)와 예측변수(predictor variable)의 관계식을 유지할 가치가 있습니다. 결과적으로 이러한 것 중에서 차분을 구할 필요가 있을 때, 모든 변수의 차분을 구하는 일이 흔합니다. 그래서 결과 모델을 차분 계산 없이 원본 데이터를 사용할 때 얻는 “수준값의 모델(model in levels)”과 구별하여 “차분값의 모델(model in differences)”이라고 부릅니다.

모델의 모든 변수가 정상성(stationarity)을 나타내면, 잔차(residual)에 대한 ARMA 오차만을 고려할 필요가 있습니다. ARIMA 오차를 고려하는 회귀 모델은 ARMA 오차를 고려하는 차분값의 회귀 모델과 같습니다. 예를 들어, ARIMA(1,1,1) 오차를 고려하는 위의 회귀 모델을 차분하면, 다음과 같은 모델을 얻습니다. \[\begin{align*} y'_t &= \beta_1 x'_{1,t} + \dots + \beta_k x'_{k,t} + \eta'_t,\\ & (1-\phi_1B)\eta'_t = (1+\theta_1B)\varepsilon_t, \end{align*}\] 여기에서 \(y'_t=y_t-y_{t-1}\), \(x'_{t,i}=x_{t,i}-x_{t-1,i}\) 이고 \(\eta'_t=\eta_t-\eta_{t-1}\) 입니다. 이는 ARMA 오차를 고려하는 차분값의 회귀 모델입니다.


  1. Harris & Sollis (2003) 에서 서로 결합된 모델로 예측하는 것을 다루었습니다.↩︎