Chapter 10 계층적 시계열 또는 그룹화된 시계열을 예측하기

주의: 이 장의 내용은 좀 더 난이도가 높고 독자가 몇 가지 기본적인 행렬 연산 지식을 가지고 있다는 것을 가정합니다.

시계열은 종종 관심 있는 다양한 속성(attribute)으로 자연스럽게 나눌 수 있습니다. 예를 들어, 자전거 제조사가 판매한 전체 자전거 수를 로드 바이크, 산악 자전거, 어린이용 자전거, 하이브리드 등과 같이 범주(category) 별로 나눌 수 있습니다. 각각을 더 자세한 범주로 나눌 수 있습니다. 예를 들어, 하이브리드 자전거는 도시용, 통학/통근용, 편안한 자전거, 트레킹 자전거 등으로 나눌 수 있습니다. 이러한 범주는 더 넓은 그룹 범주 안에 속합니다. 그래서 시계열 모음(collection)은 계층적인 합산 구조(hierarchical aggregation structure)를 따릅니다. 따라서 이것을 계층적 시계열(hierarchical time series)이라고 부릅니다. 이는 10.1 절의 주제입니다.

계층적 시계열(hierarchical time series)은 흔히 지리적인 구분 때문에 나타납니다. 예를 들면, 전체 판매량을 국가별로 나눌 수 있습니다. 그리고 각 국가 안의 주(state)별로, 각 주 안에 지역별로, 더 나아가 매장 수준까지 내려갈 수 있습니다.

자전거 제조사는 판매량을 제품 종류와 지리적인 위치를 동시에 고려하여 분배(disaggregate)할 수도 있습니다. 이 경우에는 제품 계층 구조와 지리적 계층 구조를 둘 다 사용할 수 있어서 좀 더 복잡한 합산 구조를 얻게 됩니다. 흔히 이것을 가리켜 “그룹화된 시계열(grouped time series)”이라고 부릅니다. 이는 10.2 절에서 다룹니다.

분배된(disaggregated) 시계열에 기반하여 분배된 예측값을 내는 것은 흔한 일입니다. 그리고 보통은 데이터와 같은 방식으로 예측값을 더해나가는 것이 필요합니다. 예를 들면, 주(state)별 판매량 예측값을 내기 위해서는 지역별 판매량 예측값을 더해야 합니다. 그리고 국가 수준 예측값을 얻기 위해서는 이것을 다시 더해야 합니다.

이 장에서는 어떤 방법으로 더해야 할 커다란 시계열 모임(collection)을 예측하는 작업을 다루겠습니다. 합산 구조에 걸쳐 일관적(coherent)인 예측값이 필요하다는 것이 도전 과제입니다. 즉, 시계열 모임의 합산 구조와 일관적인 방식으로 예측값을 더해나가는 것이 필요합니다. 10.3절부터 10.7절에서는 계층적 시계열과 그룹화된 시계열에서 일관된 예측값을 내는 몇 가지 방법을 다룹니다.