6.3 고전적인 분해법

고전적인 분해 기법은 1920년대에 창안되었습니다. 단순한 편이고 대부분의 다른 시계열 분해 방법의 기초가 됩니다. 고전적인 분해법에는 덧셈 분해와 곱셈 분해 이렇게 두 가지 형태가 있습니다. 아래는 주기 \(m\)이 있는 시계열입니다(즉, 분기별 데이터에서는 \(m=4\), 월별 데이터에서는 \(m=12\), 주별 패턴이 있는 일별 데이터에서는 \(m=7\)입니다).

여기에서 고전적인 분해를 다룰 때는 계절적인 성분이 매년 일정하다고 가정합니다. 때때로 곱셈 계절성에서는 계절성분을 구성하는 \(m\) 값을 “계절성 지수(seasonal indices)”라고 부릅니다.

덧셈 분해

1 단계
\(m\)이 짝수이면, \(2\times m\)-MA를 사용하여 추세-주기 성분 \(\hat{T}_t\)을 계산합니다. \(m\)이 홀수이면, \(m\)-MA를 사용하여 추세-주기 성분 \(\hat{T}_t\)을 계산합니다.
2 단계
다음과 같이 추세를 제거한 시계열을 계산합니다: \(y_t - \hat{T}_t\).
3 단계
각 계절마다 계절성분을 측정하기 위해, 해당 계절에 대해 추세를 제거한 값의 평균을 구합시다. 예를 들면, 월별 데이터에서 3월의 계절성분은 데이터에서 추세를 제거한 모든 3월 값의 평균입니다. 그러면 이러한 계절성분 값이 0 근처의 값이 되도록 조정됩니다. 이러한 월별 값을 순서대로 모으고 각 연도의 데이터에 대한 수열을 복제하여 계절성분을 구합니다. 이렇게 \(\hat{S}_t\)을 얻습니다.
4 단계
다음과 같이 측정한 계절성과 추세-주기 성분을 빼서 나머지 성분을 계산합니다: \(\hat{R}_t = y_t - \hat{T}_t - \hat{S}_t\).

곱셈 분해

고전적인 곱셈 분해법은 뺄셈을 나눗셈으로 바꾼 것만 제외하면 덧셈 분해법과 비슷합니다.

1 단계
\(m\)이 짝수이면, \(2\times m\)-MA를 사용하여 추세-주기 성분 \(\hat{T}_t\)을 계산합니다. \(m\)이 홀수이면, \(m\)-MA를 사용하여 추세-주기 성분\(\hat{T}_t\)을 계산합니다.
2 단계
다음과 같이 추세를 제거한 시계열을 계산합니다: \(y_t/ \hat{T}_t\).
3 단계
계절마다 계절성분을 측정하기 위해, 해당 계절에 대해 추세를 제거한 값의 평균을 구합시다. 예를 들면, 월별 데이터에서 3월의 계절성분은 데이터에서 추세를 제거한 모든 3월 값의 평균입니다. 그러면 이러한 계절성분 값이 \(m\) 근처의 값이 되도록 조정됩니다. 이러한 월별 지수값을 순서대로 모으고 각 연도의 데이터에 대한 수열을 복제하여 계절성분을 구합니다. 이렇게 \(\hat{S}_t\)을 얻습니다.
4 단계
다음과 같이 측정한 계절성과 추세-주기 성분을 나누어 나머지 성분을 계산합니다: \(\hat{R}_{t} = y_t /( \hat{T}_t \hat{S}_t)\).

그림 6.8은 전자 장비 지수를 고전적으로 분해한 것을 나타냅니다. 이것을 그림 6.1과 비교해보시길 바랍니다. 2009년에서 1보다 작은 나머지 값이 추세-주기 성분에서 어떤 부분이 나머지 성분으로 “유출”되었다고 말해줍니다. 추세-주기 측정으로 데이터에서 나타나는 이러한 감소가 묻히고, 해당 나머지 값은 나쁜 추세-주기 측정에 영향을 받았습니다.

elecequip %>% decompose(type="multiplicative") %>%
  autoplot() + xlab("연도") +
  ggtitle("전자 장비 지수의 고전적 곱셈 분해")
전자 장비 신규 주문 지수의 고전적 곱셈 분해.

Figure 6.8: 전자 장비 신규 주문 지수의 고전적 곱셈 분해.

고전적인 분해에 대한 첨언

고전적인 분해법이 여전히 널리 사용되고 있지만, 추천하는 방법은 아닙니다. 왜냐하면 이제 훨씬 더 나은 기법이 존재하기 때문입니다. 고전적인 분해법으로 다룰 때의 몇 가지 문제점을 아래에 요약하였습니다.

  • 처음 몇 개와 마지막 몇 개의 관측값에 대한 추세 추정값을 얻을 수 없습니다. 예를 들면, \(m=12\)일 때, 처음 여섯개와 마지막 여섯개 관측값에 대한 추세 추정값은 존재하지 않습니다. 결과적으로, 같은 기간에 대해 나머지 성분을 측정하는 것도 불가능합니다.

  • 추세-주기 측정은 (위의 예제에서 처럼) 데이터에 나타나는 급격한 증가나 감소를 과도하게 매끄럽게 합니다.

  • 고전적인 분해법은 계절성분이 매년 반복된다는 것을 가정합니다. 많은 시계열에서, 이렇게 가정하는 것이 나름 합리적입니다만, 몇몇 더 긴 시계열에 대해서는 그렇지 않습니다. 예를 들면, 전기 수요 패턴은 에어컨이 더욱 보급되면서 시간에 따라 변했습니다. 따라서 많은 지역에서 현재 계절적인 패턴에서 최대 수요 값이 에어컨 때문에 여름에 나타나지만, 수십년 전에는 난방 때문에 겨울에 나타났습니다. 고전적인 분해 기법으로는 이러한 시간적으로 변하는 계절적인 변화를 다룰 수 없습니다.

  • 가끔 짧은 기간의 시계열 값이 특별히 이상할 수 있습니다. 예를 들면, 월별 항공 탑승자 수는 노사분규에 영향을 받을 수 있고 분쟁 기간 동안 평소보다 특이한 패턴이 나타날 수 있습니다. 고전적인 방법은 이러한 종류의 특이한 값을 다루기에 적절하지 않습니다.