2.10 연습문제

  1. 도움말 함수를 사용하여 gold, woolyrnq, gas 시계열이 나타내는 패턴을 살펴봅시다.

    1. autoplot()로 시계열 각각을 그래프로 나타내봅시다.
    2. 각 시계열의 주기(frequeny)가 어떻게 됩니까? 힌트: frequency() 함수를 이용해봅시다.
    3. gold 시계열에서 튀는 값을 which.max()로 찾아봅시다. 튀는 것은 어떤 관측값이었습니까?
  2. 책 웹사이트에서 tute1.csv 파일을 내려받아봅시다. 엑셀로 tute1.csv 파일을 열어서 내용을 살펴봅시다. 열이 4개 있는 것을 확인할 수 있을 것입니다. 열 B부터 D에는 각각 분기별 판매량 시계열, 광고비, GDP가 있습니다. 판매량은 1981년부터 2005년까지 어떤 작은 회사의 분기별 판매량입니다. 광고비는 광고하는데 든 예산이고, GDP (gross domestic product)는 국내총생산입니다. 여기에서 사용하는 시계열은 물가상승률에 맞추어 조정된 것입니다.

    1. 다음과 같이 데이터를 R로 읽을 수 있습니다.
    tute1 <- read.csv("tute1.csv", header=TRUE)
    View(tute1)
    1. 데이터를 시계열 형태로 바꿔봅시다.
    mytimeseries <- ts(tute1[,-1], start=1981, frequency=4)

    (분기명이 있는 첫 번째 열은 필요하지 않기 때문에, [,-1]로 제거합니다.)

    1. 3개의 각 시계열을 시간 그래프(time plot)로 나타내봅시다.
    autoplot(mytimeseries, facets=TRUE)

    facets=TRUE를 넣지 않으면 어떻게 되는지 확인해봅시다.

  3. 월별 호주 소매 데이터를 책 웹사이트에서 내려받으시길 바랍니다. 이 파일은 호주 여러 주에서 기록된 다양한 물품의 소매 판매량을 담고 있고 엑셀(MS-Excel) 파일 형태로 되어있습니다.

    1. 다음과 같은 코드를 사용하여 R에서 데이터를 읽을 수 있습니다:

      retaildata <- readxl::read_excel("retail.xlsx", skip=1)

      두 번째 입력값(skip=1)은 엑셀의 시트에 두 개의 머리글(header) 행이 있기 때문에 필요합니다.

    2. 시계열 중에서 하나를 다음과 같이 선택합니다(하지만 읽어들인 데이터의 열 이름을 여러분 자신이 선택한 열의 이름으로 교체하기 바랍니다: 왜냐하면 열의 이름이 매우 길고 복잡하기 때문입니다):

      myts <- ts(retaildata[,"A3349873A"], 
        frequency=12, start=c(1982,4))
    3. 다음과 같은 함수를 이용하여 여러분이 고른 소매 시계열을 살펴봅시다:

      autoplot(), ggseasonplot(), ggsubseriesplot(), gglagplot(), ggAcf()

      어떤 계절성, 주기성, 그리고 추세를 발견할 수 있습니까? 이 시계열에 관하여 무엇을 알 수 있습니까?

  4. 다음과 같은 시계열의 시간 그래프를 그려봅시다. bicoal, chicken, dole, usdeaths, lynx, goog, writing, fancy, a10, h02.

    • help()를 사용하여 각 시계열에 있는 데이터를 살펴봅시다.
    • goog 데이터를 그린 그래프의 제목과 축 라벨을 바꿔봅시다.
  5. ggseasonplot()ggsubseriesplot() 함수를 사용하여 다음과 같은 시계열에서 계절성을 살펴봅시다: writing, fancy, a10, h02.

    • 계절성 패턴에 대해 어떤 이야기를 할 수 있겠습니까?
    • 어떤 특이한 연도를 찾을 수 있겠습니까?
  6. 다음과 같은 그래픽 함수를 사용해봅시다: autoplot(), ggseasonplot(), ggsubseriesplot(), gglagplot(), ggAcf() 그리고 다음과 같은 시계열에서 특징을 살펴봅시다: hsales, usdeaths, bricksq, sunspotarea, gasoline.

    • 계절성, 주기성, 추세를 찾을 수 있습니까?
    • 시계열에서 무엇을 알 수 있습니까?
  7. arrivals 데이터 모음에는 분기별 일본, 뉴질랜드, 영국, 미국에서 호주로 들어오는 국제선 항공객(단위: 천) 정보가 있습니다.

    • autoplot(), ggseasonplot(), ggsubseriesplot()을 사용해보고, 이러한 4개국을 서로 비교해봅시다.
    • 어떤 특이한 관측값을 찾아낼 수 있습니까?
  8. 다음의 시계열 그래프와 ACF 그래프는 4개의 서로 다른 시계열과 대응됩니다. 두 번째 행의 ACF 그래프 중의 하나를 첫 번째 행의 각각의 시간 그래프(time plot)와 일치시켜봅시다.

  9. pigs 데이터에는 1980년 1월부터 1995년 8월까지 호주 빅토리아주에서 매달 도축한 전체 돼지수 정보가 있습니다. mypigs <- window(pigs, start=1990)을 사용하여 데이터를 1990년부터 선택해봅시다. mypigs 시계열에 autoplotggAcf를 사용하고 그림 2.162.17 의 백색잡음 그래프와 비교해봅시다.

  10. dj에는 292 연속 거래일 다우 존스 지수 데이터가 있습니다. ddj <- diff(dj)를 사용하여 일별 지수 변화를 계산해봅시다. ddjddj의 ACF를 그려봅시다. 다우 존스 지수의 일별 변화가 백색잡음처럼 보입니까?