10.6 사상 행렬

지금까지 고려한 모든 기법은 공통적인 표기법으로 나타낼 수 있습니다.

합산 제약조건을 무시하고 모든 시계열을 독립적으로 예측하는 상황을 생각해봅시다. 이것들을 기준 예측(base forecasts)값이라고 부르고 \(\hat{\bm{y}}_h\)라고 씁시다. 여기에서 \(h\)는 예측수평선(forecast horizon)입니다. 이것은 데이터 \(\bm{y}_t\)와 같은 순서로 쌓입니다.

그러면 계층적이거나 그룹화된 구조에 대한 모든 예측 접근 방식은 일반적으로 다음과 같이 쓸 수 있습니다. \[\begin{equation} \tilde{\bm{y}}_h=\bm{S}\bm{P}\hat{\bm{y}}_h, \tag{10.6} \end{equation}\] 여기에서 \(\bm{P}\)은 기준 예측값을 밑바닥 수준으로 투영하는 행렬이고, 합산 행렬 \(\bm{S}\)은 일관된 예측값 \(\tilde{\bm{y}}_h\)의 집합을 내기 위해 합산 구조를 이용하여 합산합니다.

행렬 \(\bm{P}\)은 구현한 접근 방식에 따라 정의됩니다. 예를 들어 그림 10.1의 계층 구조를 예측하는데 상향식 접근 방식을 사용한다면, \[ \bm{P}= \begin{bmatrix} 0 & 0 & 0 & 1 & 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 1 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1\\ \end{bmatrix}. \] \(\bm{P}\)는 두 부분을 포함한다는 것에 주목합시다. 처음 3개의 열에서 밑바닥 수준 위에 있는 시계열의 기준 예측값은 0이고, \(m\)차원 항등 행렬(identity matrix)은 밑바닥 수준의 기준 예측값만 고릅니다. 이것들은 \(\bm{S}\) 행렬로 더합니다.

하향식 접근 방식 중의 어떤 하나를 사용했다면, \[ \bm{P}= \begin{bmatrix} p_1 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\ p_2 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\ p_3 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\ p_4 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\ p_5 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\ \end{bmatrix}. \] 첫 번째 열은 행렬 \(\bm{S}\)로 계층 구조가 합산되게 하기 위해 꼭대기 수준의 기준 예측값을 밑바닥 단계로 분배하는 비율을 포함합니다. 나머지 행은 합산의 가장 높은 수준 아래의 기준 예측값을 0으로 하도록 다음과 같이 씁니다.

중간 접근 방식에서는 \(\bm{P}\) 행렬은 위의 두 가지의 조합이 될 것입니다. 비율값을 이용하면, 몇몇의 미리 고른 수준의 기준 예측값은 밑바닥 수준으로 분리될 것이고, 다른 모든 기준 예측값은 0이 될 것이며, 밑바닥 수준의 예측값은 합산 행렬을 통해 더해질 것입니다.

예측 조정

(10.6)을 다음과 같이 다시 쓸 수 있습니다. \[\begin{equation} \tilde{\bm{y}}_h=\bm{R}\hat{\bm{y}}_h, \tag{10.7} \end{equation}\] 여기에서 \(\bm{R}=\bm{S}\bm{P}\)은 “조정 행렬(reconciliation matrix)”입니다. 즉, 일관되지 않은 기준 예측값 \(\hat{\bm{y}}_h\)을 조정하여 일관된 예측값 \(\tilde{\bm{y}}_h\)을 내도록 합니다.

지금까지 다룬 기법에서는, 실제적인 조정이 이뤄지지 않았습니다. 왜냐하면 합산 구조에서 한 수준의 예측값에 근거한 기법이기 때문입니다. 즉, 다른 모든 수준에서 예측값을 얻기 위해 합산하거나 분배한 경우만 다룬 것입니다. 하지만, 일반적으로는, 다른 행렬 \(\bm{P}\)을 사용할 수 있습니다. 그리고 일관된 예측값을 내도록 \(\bm{R}\)이 모든 기준 예측값을 결합하고 조정할 것입니다.

사실, 가장 정확한 조정 예측값을 얻기 위한 최적 행렬 \(\bm{P}\)을 찾을 수 있습니다.