• Forecasting: Principles and Practice
  • 서문
  • 1 시작하기
    • 1.1 예측 될 수 있는 것이란?
    • 1.2 예측, 계획 그리고 목표
    • 1.3 어떤 것을 예측할 지 결정하기
    • 1.4 예측 데이터와 기법
    • 1.5 몇 가지 사례 연구
    • 1.6 예측 작업의 기본 단계
    • 1.7 통계적 예측 관점
    • 1.8 연습문제
    • 1.9 더 읽을 거리
  • 2 시계열 시각화
    • 2.1 ts 객체
    • 2.2 시간 그래프
    • 2.3 시계열 패턴
    • 2.4 계절성 그래프
    • 2.5 계절성 부시계열 그래프
    • 2.6 산점도
    • 2.7 시차 그래프
    • 2.8 자기상관
    • 2.9 백색잡음
    • 2.10 연습문제
    • 2.11 더 읽을 거리
  • 3 예측가의 도구 상자
    • 3.1 몇 가지 단순한 예측 기법
    • 3.2 변환과 조정
    • 3.3 잔차 진단
    • 3.4 예측 정확도 평가
    • 3.5 예측 구간
    • 3.6 R의 forecast 패키지
    • 3.7 연습문제
    • 3.8 더 읽을 거리
  • 4 판단 예측
    • 4.1 한계점에 주의하기
    • 4.2 핵심 원리
    • 4.3 델파이 기법
    • 4.4 유사점으로 예측하기
    • 4.5 시나리오 예측
    • 4.6 신제품 예측
    • 4.7 판단 조정
    • 4.8 더 읽을 거리
  • 5 시계열 회귀 모델
    • 5.1 선형 모델
    • 5.2 최소 제곱 추정
    • 5.3 회귀 모델 평가
    • 5.4 몇 가지 유용한 예측변수
    • 5.5 예측변수 선택
    • 5.6 회귀로 예측하기
    • 5.7 행렬 정식화
    • 5.8 비선형 회귀
    • 5.9 상관관계, 인과관계, 그리고 예측
    • 5.10 연습문제
    • 5.11 더 읽을 거리
  • 6 시계열 분해
    • 6.1 시계열 성분
    • 6.2 이동평균
    • 6.3 고전적인 분해법
    • 6.4 X11 분해
    • 6.5 SEATS 분해
    • 6.6 STL 분해
    • 6.7 추세와 계절성의 강도를 측정하기
    • 6.8 분해법으로 예측하기
    • 6.9 연습문제
    • 6.10 더 읽을 거리
  • 7 지수평활
    • 7.1 단순 지수평활
    • 7.2 추세 기법
    • 7.3 홀트-윈터스의 계절성 기법
    • 7.4 지수 평활 기법 분류 체계
    • 7.5 지수 평활에 대한 혁신 상태 공간 모델
    • 7.6 추정과 모델 선택
    • 7.7 ETS 모델로 예측하기
    • 7.8 연습문제
    • 7.9 더 읽을 거리
  • 8 ARIMA 모델
    • 8.1 정상성과 차분
    • 8.2 후방이동 기호
    • 8.3 자기회귀 모델
    • 8.4 이동 평균 모델
    • 8.5 비-계절성 ARIMA 모델
    • 8.6 추정과 차수 선택
    • 8.7 R에서 ARIMA 모델링
    • 8.8 예측하기
    • 8.9 계절성 ARIMA 모델들
    • 8.10 ARIMA vs ETS
    • 8.11 연습문제
    • 8.12 더 읽을 거리
  • 9 동적 회귀 모델
    • 9.1 추정
    • 9.2 R에서 ARIMA 오차를 고려하는 회귀
    • 9.3 예측하기
    • 9.4 확률적 추세와 확정적 추세
    • 9.5 동적 조화 회귀
    • 9.6 시차 예측변수
    • 9.7 연습문제
    • 9.8 더 읽을 거리
  • 10 계층적 시계열 또는 그룹화된 시계열을 예측하기
    • 10.1 계층적 시계열
    • 10.2 그룹화된 시계열
    • 10.3 상향식 접근 방식
    • 10.4 하향식 접근 방식
    • 10.5 중간 접근 방식
    • 10.6 사상 행렬
    • 10.7 최적 조정 접근법
    • 10.8 연습문제
    • 10.9 더 읽을 거리
  • 11 고급 예측 기법
    • 11.1 복잡한 계절성
    • 11.2 벡터 자기회귀
    • 11.3 신경망 모델
    • 11.4 붓스트랩과 배깅
    • 11.5 연습 문제
    • 11.6 더 읽을 거리
  • 12 몇 가지 실제 예측 문제
    • 12.1 주별, 일별, 그리고 일별 이하의 데이터
    • 12.2 개수를 세서 만든 시계열
    • 12.3 예측값이 반드시 범위 안에 있도록 만들기
    • 12.4 예측조합
    • 12.5 합산 값에 대한 예측 구간
    • 12.6 과거 재구성
    • 12.7 아주 긴 시계열과 아주 짧은 시계열
    • 12.8 학습 데이터와 테스트 데이터 예측하기
    • 12.9 결측값과 이상값 다루기
    • 12.10 더 읽을 거리
  • 부록: R 사용하기
  • 부록: 강사를 위한 내용
  • 부록: 리뷰
  • 번역본
  • 저자 소개
  • 책 또는 내려받을 수 있는 버전을 구매하세요
  • Help
  • 참고 문헌
  • Published by OTexts™ with bookdown

Forecasting: Principles and Practice

9.4 확률적 추세와 확정적 추세

선형 추세를 모델링하는 두 가지 다른 방법이 있습니다. 확정적 추세(deterministic trend)는 다음과 같은 회귀 모델로 얻습니다. \[ y_t = \beta_0 + \beta_1 t + \eta_t, \] 여기에서 \(\eta_t\)는 ARMA 과정입니다. 확률적 추세(stochastic trend)는 다음과 같은 모델로 얻습니다. \[ y_t = \beta_0 + \beta_1 t + \eta_t, \] 여기에서 \(\eta_t\)는 \(d=1\)인 ARIMA 과정입니다. 이 경우에, \(y_t' = \beta_1 + \eta_t'\)가 되도록 양변을 뺍니다. 여기에서 \(\eta_t'\)는 ARMA 과정입니다. 다르게 말하면, \[ y_t = y_{t-1} + \beta_1 + \eta_t'. \] 이것은 표류(drift)가 있는 확률보행(random walk)과 비슷합니다만, 오차항은 단순한 백색잡음(white noise)이 아니라 ARMA 과정입니다.

이러한 모델이 꽤 비슷한 것처럼 보이더라도(\(\eta_t\)에 차분을 계산해야하는 횟수에만 차이가 있습니다), 예측 특성은 꽤 다릅니다.

예측: 호주에 입국하는 국제선 방문객

autoplot(austa) + xlab("연도") +
  ylab("백만명") +
  ggtitle("호주에 입국하는 전체 연간 국제선 방문객")
매년 호주에 입국하는 국제선 방문객, 1980--2015.

Figure 9.9: 매년 호주에 입국하는 국제선 방문객, 1980–2015.

그림 9.9은 1980년부터 2015년까지 매년 호주에 입국하는 국제선 방문객의 전체 수를 나타냅니다. 이러한 데이터를 확정적 추세(deterministic trend) 모델과 확률적 추세(stochastic trend) 모델로 맞출 것입니다.

확정적 추세(deterministic trend) 모델은 다음과 같이 얻습니다.

trend <- seq_along(austa)
(fit1 <- auto.arima(austa, d=0, xreg=trend))
#> Series: austa 
#> Regression with ARIMA(2,0,0) errors 
#> 
#> Coefficients:
#>         ar1     ar2  intercept   xreg
#>       1.113  -0.380      0.416  0.171
#> s.e.  0.160   0.158      0.190  0.009
#> 
#> sigma^2 = 0.0298:  log likelihood = 13.6
#> AIC=-17.2   AICc=-15.2   BIC=-9.28

이 모델은 다음과 같이 쓸 수 있습니다. \[\begin{align*} y_t &= 0.416 + 0.171 t + \eta_t \\ \eta_t &= 1.113 \eta_{t-1} -0.380 \eta_{t-2} + \varepsilon_t\\ \varepsilon_t &\sim \text{NID}(0,0.030). \end{align*}\]

추정된 방문하는 사람 수의 증가량은 연간 0.17 백만명입니다.

한편, 확률적 추세(stochastic trend) 모델을 다음과 같이 추정할 수 있습니다.

(fit2 <- auto.arima(austa, d=1))
#> Series: austa 
#> ARIMA(0,1,1) with drift 
#> 
#> Coefficients:
#>         ma1  drift
#>       0.301  0.173
#> s.e.  0.165  0.039
#> 
#> sigma^2 = 0.0338:  log likelihood = 10.62
#> AIC=-15.24   AICc=-14.46   BIC=-10.57

이 모델은 \(y_t-y_{t-1} = 0.173 + \eta'_t\)로 쓸 수 있거나 아래와 같이도 쓸 수 있습니다. \[\begin{align*} y_t &= y_0 + 0.173 t + \eta_t \\ \eta_t &= \eta_{t-1} + 0.301 \varepsilon_{t-1} + \varepsilon_{t}\\ \varepsilon_t &\sim \text{NID}(0,0.034). \end{align*}\]

이 경우에, 추정된 방문하는 사람 수의 증가량은 연간 0.17 백만명입니다. 증가량 추정값이 비슷하더라도 그림 9.10에서 나타나는 것처럼 예측구간은 다르게 나타납니다. 특히, 확률적 추세(stochastic trend)는 오차에 정상성이 나타나지 않기 때문에 예측구간이 훨씬 넓습니다.

fc1 <- forecast(fit1,
  xreg = length(austa) + 1:10)
fc2 <- forecast(fit2, h=10)
autoplot(austa) +
  autolayer(fc2, series="확률적 추세") +
  autolayer(fc1, series="확정적 추세") +
  ggtitle("확정적 추세 모델과 확률적 추세 모델에서 얻은 예측값") +
  xlab("연도") + ylab("호주 방문객 (백만)") +
  guides(colour=guide_legend(title="예측값"))
확정적 추세 모델과 확률적 추세 모델을 사용하여 매년 호주에 입국하는 국제선 방문객을 예측한 것.

Figure 9.10: 확정적 추세 모델과 확률적 추세 모델을 사용하여 매년 호주에 입국하는 국제선 방문객을 예측한 것.

확정적 추세(deterministic trend)에는 추세의 기울기가 시간에 따라서 변하지 않을 것이라는 가정이 들어가 있습니다. 반면에, 확률적인 추세(stochastic trend)는 변할 수 있고 추정된 증가량에는 과거 기간 동안 평균 증가만 가정하고, 미래에 나타날 성장률일 필요는 없습니다. 결과적으로, 예측구간이 미래 성장에 있어서 더 큰 불확실성을 허용하기 때문에 확률적 추세(stochastic trend)로 예측하는 것이 더 안전하고, 특별히 예측수평선(forecast horizon)이 좀 더 길 때는 더더욱 그렇습니다.