9.7 연습문제

  1. 자동차 부품 회사의 월별 판매량과 광고 데이터를 살펴봅시다(데이터 모음 advert).

    1. autoplot을 이용하여 데이터를 그래프로 나타내봅시다. facets=TRUE로 두는 것이 왜 유용합니까?

    2. tslm() 함수를 이용하여 표준 회귀 모델 \(y_t = a + b x_t + \eta_t\)을 맞춰봅시다. 여기에서 \(y_t\)는 판매량이고, \(x_t\)는 광고 데이터입니다.

    3. 잔차에 유의미한 자기상관이 있다는 것을 증명해봅시다.

    4. Arima 함수를 사용하는 대신에 아래의 함수를 사용하면 어떤 차이가 있습니까?

      Arima(advert[,'sales'], xreg=advert[,'advert'], order=c(0,0,0))
    5. auto.arima()를 이용하여 모델을 다시 맞춰봅시다. 오차 모델이 추정된 매개변수에 얼마나 많은 차이를 만들어냅니까? 오차에 대해 어떤 ARIMA 모델을 골라야합니까?

    6. 맞춘 모델의 잔차를 확인해봅시다.

    7. 다음 6달에 대해 광고 비용이 정확히 1달에 10 단위라고 가정하여, 다음 6달에 대한 판매량 예측값을 예측구간과 함께 얻어봅시다.

  2. 이 연습문제에서는 1875년부터 1972년까지 휴론(Huron) 호수의 수위를 기록한 데이터 모음 huron을 사용합니다.

    1. 1920년에 매듭(knot)과 ARMA 오차 구조가 있는 단계적(stepwise) 선형 추세 모델로 휴론 호수 데이터를 맞춰봅시다.
    2. 다음 30년의 수위를 예측해봅시다.
  3. 이 연습문제에서는 motel 데이터를 다룹니다: 이 데이터는 1980년 1월부터 1995년 6월까지 호주 빅토리아 주의 호텔, 모텔, 그리고 게스트 하우스에서 숙박한 월별 전체 숙박료와 사용된 전체 객실수 담고 있습니다. 전체 월별 수입의 단위는 1000 호주 달러입니다. 사용된 전체 객실수의 단위는 1000개입니다.

    1. 이 데이터를 가지고 빅토리아 주의 숙박 시설의 월별 평균 비용을 계산해봅시다.
    2. cpimel을 사용하여 월별 CPI를 추정해봅시다.
    3. 두 변수의 시계열을 그려보고 어떤 모형을 맞추기 전에 두 변수에 왜 로그를 취해야하는지 설명해봅시다.
    4. ARIMA 오차가 있는 적절한 회귀 모델을 맞춰봅시다. 최종 모델에 도달한 이유를 설명해봅시다.
    5. 맞춘 모델을 가지고 다음 12개월의 객실 당 평균 가격을 예측해봅시다. (힌트: CPI 그림의 예측값을 먼저 낼 필요가 있을 것입니다.)
  4. 5.10 절에서 연습 문제 6의 gasoline 시계열의 일부를 조화 회귀 모델로 맞췄습니다. 이 모델로 돌아가서, 더 많은 데이터와 ARMA 오차를 가지고 모델을 확장하겠습니다.

    1. tslm()을 이용하여, 단계별 선형 시간 추세가 있는 조화 회귀로 gasoline 시계열 전체를 맞춰봅시다. 추세에서 매듭의 위치와, AICc나 CV 값을 최소화하여 넣어야 할 푸리에 항의 적절한 수를 골라봅시다.
    2. 이제 보정된 오차를 허용하기 위해 tslm()에서 사용했던 같은 예측변수를 유지하고 auto.arima()를 이용하여 모델을 다시 맞춰봅시다.
    3. checkresiduals() 함수를 이용하여 최종 모델의 잔차를 확인해봅시다. 잔차가 충분히 계속될 백색잡음처럼 보입니까? 그렇지 않다면, 모델을 변형해보거나, 데이터의 처음 몇 년을 빼봅시다.
    4. 백색잡음 잔차가 있는 모델을 가지고, 다음 해의 예측값을 내봅시다.
  5. 전량 소비는 종종 온도의 함수로 모델링합니다. 온도는 일별 난방도와 냉방도로 측정합니다. 난방도는 일별 평균 기온이 \(18^\circ\)C 아래일 때, \(18^\circ\)C에서 일별 평균 기온을 뺀 것이고 그렇지 않은 경우에는 0입니다. 이렇게 하여 기온이 내려갈 때 난방을 하는 사람의 필요를 측정합니다. 냉방도는 온도가 올라갈 때 냉방을 하는 사람의 필요를 측정합니다. 냉방도는 일별 평균 기온이 \(18^\circ\)C 이상일 때, 일별 평균 기온에서 \(18^\circ\)C를 뺀 것입니다. \(y_t\)를 킬로와트시 단위의 월별 전체 전력사용량으로 두고, \(x_{1,t}\)을 월별 전체 난방도로 두고, \(x_{2,t}\)을 월별 전체 냉방도로 둡시다.

    어떤 분석가가 이러한 데이터를 다음의 모델로 맞춥니다: \[y^*_t = \beta_1x^{1,t} + \beta_2x^*{2,t} + \eta_t,\] 여기에서 \[(1-B)(1-B^{12})\eta_t = \frac{1-\theta_1 B}{1-\phi_{12}B^{12} - \phi_{24}B^{24}}\varepsilon_t\] 그리고 \(y^*_t = \log(y_t)\), \(x^{1,t} = \sqrt{x{1,t}}\) and \(x^*{2,t}=\sqrt{x{2,t}}\).

    1. \(\eta_t\)에 대해 어떤 종류의 ARIMA 모델이 나왔습니까?
    2. 추정된 계수는 다음과 같습니다.
    매개변수 추정값 s.e. \(Z\) \(P\)-값
    \(\beta_1\) 0.0077 0.0015 4.98 0.000
    \(\beta_2\) 0.0208 0.0023 9.23 0.000
    \(\theta_1\) 0.5830 0.0720 8.10 0.000
    \(\phi_{12}\) -0.5373 0.0856 -6.27 0.000
    \(\phi_{24}\) -0.4667 0.0862 -5.41 0.000

    \(\beta_1\)\(\beta_2\)의 추정값이 전력 소비에 대한 어떤 정보를 담고 있는지 설명해봅시다.

    1. 예측에 더욱 적합한 형태로 식을 적어봅시다.
    2. 다음 12달의 전력 수요를 예측할 때 이 모델을 어떻게 사용할 수 있는지 설명해봅시다.
    3. 표준 회귀 패키지로 데이터를 모델링하는 대신에 ARIMA 모델로 \(\eta_t\) 항을 왜 모델링해야 하는지 설명해봅시다. 추정값의 특징과, 표준 회귀 결과의 유효성, 예측값을 낼 때 \(\eta_t\) 모델의 중요성을 설명해봅시다.
  6. 앞의 장들에서 다룬 소매 시계열에 대해서:

    1. 계절성에 대한 푸리에 항이 있는 적절한 동적 회귀 모델을 세워봅시다. 모델에 넣을 푸리에 항의 수를 정하기 위해 AIC를 이용해봅시다. (이전에 찾았던 것과 같은 박스-칵스(Box-Cox) 변환을 사용해야할 수도 있습니다.)
    2. 맞춘 모델의 잔차를 확인해봅시다. 잔차 시계열이 백색잡음처럼 보입니까?
    3. 바로 위에서 얻은 예측값을 다른 대안 모델을 이용하여 이전에 얻은 것과 비교해봅시다.