6.1 시계열 성분

덧셈 분해(additive decomposition)를 가정하면, 다음과 같이 쓸 수 있습니다. \[ y_{t} = S_{t} + T_{t} + R_t, \] 여기에서 \(y_{t}\)는 데이터이고, \(S_{t}\)는 계절성분, \(T_{t}\)는 추세-주기 성분, \(R_t\)는 나머지 성분입니다. \(y_{t}\), \(S_{t}\), \(T_{t}\), \(R_t\)는 시점 \(t\)에서의 양입니다. 덧셈 모델 대신에, 곱셈 분해(multiplicative decomposition)는 다음과 같이 쓸 수 있을 것입니다. \[ y_{t} = S_{t} \times T_{t} \times R_t. \] 계절성 요동의 크기나 추세-주기 주위의 변동이 시계열의 수준에 의해 변하지 않으면, 덧셈 분해가 가장 적절합니다. 계절성 패턴에서 변동이나 추세-주기 주위의 변동이 시계열의 수준(level)에 비례하는 것으로 나타날 때는, 곱셈 분해가 더 적절합니다. 흔히 경제 분야 시계열을 다룰 때 곱셈 분해를 사용합니다.

곱셈 분해를 사용하는 대신에, 먼저 시계열의 변동이 시간에 따라 안정적으로 나타나는 것으로 보일 때까지 데이터를 변환하여, 덧셈 분해를 사용하는 것도 한 가지 방법입니다. 로그 변환을 사용하면, 아래 식에서 볼 수 있는 이유 때문에 덧셈 모델이 곱셈 분해를 사용했을 때와 같게 됩니다. \[ y_{t} = S_{t} \times T_{t} \times R_t \quad\text{는 오른쪽 식과 같습니다}\quad \log y_{t} = \log S_{t} + \log T_{t} + \log R_t. \]

전자 장비 제조

이 장의 뒷 부분에서 \(S_{t}\), \(T_{t}\), \(R_{t}\) 성분을 구할 수 있는 몇 가지 기법을 살펴볼 것이지만, 먼저 예제 하나를 살펴보는 것이 도움이 되겠습니다. 그림 6.1의 전자 장비에 대한 신규 주문 지수 데이터를 분해해보겠습니다. 이 데이터는 유럽 지역(16개국)에서 전자 장비(컴퓨터, 전자, 광학 제품)에 대한 신규 주문량을 나타냅니다. 근무일 기준으로 조정되었고, 2005년 값이 100이 되도록 조정된 데이터입니다.

전자 장비 주문: 추세-주기 성분 (빨간색) 그리고 원본 데이터 (회색).

Figure 6.1: 전자 장비 주문: 추세-주기 성분 (빨간색) 그리고 원본 데이터 (회색).

그림 6.1에서 추세-주기 성분 \(T_t\)는 빨간색, 원본 데이터 \(y_t\)는 회색입니다. 계절성과 작은 무작위적 변동(random fluctuation)을 무시하면, 추세-주기가 시계열의 전반적인 움직임을 나타냅니다.

그림 6.2은 데이터를 덧셈 분해한 것입니다. 이 예제에서는 성분을 추정하기 위해서 6.6 절에서 다룬 STL 기법을 사용했습니다.

전자 장비 주문(위)과 세 가지 덧셈 성분.

Figure 6.2: 전자 장비 주문(위)과 세 가지 덧셈 성분.

그림 6.2의 아래쪽 세 패널에 이 세 가지 성분을 각각 나타냈습니다. 이러한 성분은 모아서 더하면, 위쪽 패널에 나타낸 데이터를 재구성할 수 있습니다. 계절성분이 시간에 따라 느리게 변하여, 두 개의 연이은 연도가 비슷한 패턴을 갖고, 서로 멀리 떨어진 연도는 다른 계절성 패턴을 갖도록 한다는 것에 주목합시다. 아래쪽 패널의 나머지 성분은 계절과 추세-주기 성분을 데이터에서 뺀 나머지입니다.

각 패널의 오른쪽의 회색 막대는 성분의 상대적인 눈금을 나타냅니다. 각 회색 막대는 같은 길이를 나타내지만 세로축 눈금에 따라 각 그림에서 크기가 다르게 보입니다. 가장 아래 패널에서 큰 회색 막대는 나머지 성분의 변동이 데이터에서 나타나는 변동보다 약 1/4 정도로 작다는 것을 나타냅니다. 아래에서부터 3개의 패널에서 나타나는 회색 막대를 데이터 패널에서 나타나는 것과 같게 맞추면, 모든 패널은 같은 눈금으로 나타날 것입니다.

계절성으로 조정된 데이터

원본 데이터에서 계절성분을 제거한 결과 값을 “계절성으로 조정된(seasonally adjusted)” 데이터라고 부릅니다. 덧셈 분해에서, 계절성으로 조정된 데이터는 \(y_{t}-S_{t}\)로 주어지고, 곱셈 분해에서는 \(y_{t}/S_{t}\)을 이용하여 계절성으로 조정된 값을 구합니다.

그림 6.3은 계절성으로 조정된 전자 장비 지수들을 나타냅니다.

계절성으로 조정된 전자 장비 구매(파란색)와 원본 데이터(회색).

Figure 6.3: 계절성으로 조정된 전자 장비 구매(파란색)와 원본 데이터(회색).

계절성에 의한 변동이 주된 관심사가 아니라면, 계절성으로 조정된 시계열은 유용할 수 있습니다. 예를 들면, 보통 월별 실업률 데이터를 다룰 때 계절성 변동보다는 중요한 경제 상황 때문에 나타나는 변동을 강조하기 위해 데이터를 계절성으로 조정합니다. 학교를 졸업한 사람들이 일자리를 찾는 것 때문에 나타나는 실업률 증가는 계절성 변동입니다만, 경기 침체 때문에 실업자가 많아서 생기는 증가는 비-계절성입니다. 실업률 데이터를 연구하는 대부분의 사람들은 비-계절성 변동에 관심이 많습니다. 따라서, 실업률 데이터(와 다른 많은 경제 분야 시계열)을 주로 계절성으로 조정하여 다룹니다.

계절성으로 조정된 시계열에는 추세-주기 성분도 있고 나머지 성분도 있습니다. 그래서, 시계열이 “매끄럽지” 않고, “하락세”나 “상승세”라는 표현이 오해를 불러 일으킬 수 있습니다. 시계열에서 전환점을 살펴보는 것과 어떤 방향으로의 변화를 해석하려는 것이 목적이라면, 계절성으로 조정된 데이터보다는 추세-주기 성분을 사용하는 것이 더 낫습니다.