8.3 자기회귀 모델

다중 회귀 모델에서, 목표 예상 변수(forecast variable)의 선형 조합을 이용하여 관심 있는 변수를 예측했습니다. 자기회귀 모델에서는, 변수의 과거 값의 선형 조합을 이용하여 관심 있는 변수를 예측합니다. 자기회귀(autoregressive)라는 단어에는 자기 자신에 대한 변수의 회귀라는 의미가 있습니다.

따라서, 차수 \(p\)의 자기회귀 모델(autoregressive models)은 다음과 같이 쓸 수 있습니다. \[ y_{t} = c + \phi_{1}y_{t-1} + \phi_{2}y_{t-2} + \dots + \phi_{p}y_{t-p} + \varepsilon_{t}, \] 여기에서 \(\varepsilon_t\)는 백색잡음(white noise)입니다. \(y_t\)의 시차 값을 예측변수(predictor)로 다루는 것만 제외하면 다중 회귀처럼 생겼습니다. 이것을 \(p\) 자기회귀 모델인 AR(\(p\)) 모델이라고 부르겠습니다.

자기회귀 모델(autoregressive model)은 다양한 종류의 서로 다른 시계열 패턴을 매우 유연하게 다룰 수 있습니다. 그림 8.5에 있는 두 시계열은 AR(1) 모델과 AR(2) 모델로 얻은 시계열입니다. 매개변수 \(\phi_1,\dots,\phi_p\)을 바꾸면 다른 시계열 패턴이 나옵니다. 오차항 \(\varepsilon_t\)의 분산은 시계열의 패턴이 아니라 눈금만 바꿀 것입니다.

매개변수를 다르게 설정한 자기회귀 모델로부터 얻은 데이터의 두 가지 예. 왼쪽: $y_t = 18 -0.8y_{t-1} + \varepsilon_t$인 AR(1). 오른쪽: $y_t = 8 + 1.3y_{t-1}-0.7y_{t-2}+\varepsilon_t$인 AR(2). 두 가지 경우 모두, $\varepsilon_t$은 평균이 0이고 분산이 1인 정규 분포를 따르는 백색잡음입니다.

Figure 8.5: 매개변수를 다르게 설정한 자기회귀 모델로부터 얻은 데이터의 두 가지 예. 왼쪽: \(y_t = 18 -0.8y_{t-1} + \varepsilon_t\)인 AR(1). 오른쪽: \(y_t = 8 + 1.3y_{t-1}-0.7y_{t-2}+\varepsilon_t\)인 AR(2). 두 가지 경우 모두, \(\varepsilon_t\)은 평균이 0이고 분산이 1인 정규 분포를 따르는 백색잡음입니다.

AR(1) 모델은:

  • \(\phi_1=0\)일 때, \(y_t\)는 백색잡음과 같습니다;
  • \(\phi_1=1\)이고 \(c=0\)일 때, \(y_t\)는 확률보행 모델과 같습니다;
  • \(\phi_1=1\)이고 \(c\ne0\)일 때, \(y_t\)는 표류가 있는 확률보행 모델과 같습니다;
  • \(\phi_1<0\)일 때, \(y_t\)는 평균값을 중심으로 진동하는 경향을 나타냅니다.

보통은 자기회귀 모델을 정상성을 나타내는 데이터에만 사용합니다. 이 경우에는 매개변수 값에 대한 몇몇 제한조건이 필요합니다.

  • AR(1) 모델의 경우: \(-1 < \phi_1 < 1\).
  • AR(2) 모델의 경우: \(-1 < \phi_2 < 1\), \(\phi_1+\phi_2 < 1\), \(\phi_2-\phi_1 < 1\).

\(p\ge3\)일 때는, 제한조건이 훨씬 더 복잡합니다. 모델을 다룰 때 R에서 이러한 제한조건을 처리해줍니다.