2.10 연습문제
도움말 함수를 사용하여
gold
,woolyrnq
,gas
시계열이 나타내는 패턴을 살펴봅시다.autoplot()
로 시계열 각각을 그래프로 나타내봅시다.- 각 시계열의 주기(frequeny)가 어떻게 됩니까? 힌트:
frequency()
함수를 이용해봅시다. gold
시계열에서 튀는 값을which.max()
로 찾아봅시다. 튀는 것은 어떤 관측값이었습니까?
책 웹사이트에서
tute1.csv
파일을 내려받아봅시다. 엑셀로tute1.csv
파일을 열어서 내용을 살펴봅시다. 열이 4개 있는 것을 확인할 수 있을 것입니다. 열 B부터 D에는 각각 분기별 판매량 시계열, 광고비, GDP가 있습니다. 판매량은 1981년부터 2005년까지 어떤 작은 회사의 분기별 판매량입니다. 광고비는 광고하는데 든 예산이고, GDP (gross domestic product)는 국내총생산입니다. 여기에서 사용하는 시계열은 물가상승률에 맞추어 조정된 것입니다.- 다음과 같이 데이터를 R로 읽을 수 있습니다.
<- read.csv("tute1.csv", header=TRUE) tute1 View(tute1)
- 데이터를 시계열 형태로 바꿔봅시다.
<- ts(tute1[,-1], start=1981, frequency=4) mytimeseries
(분기명이 있는 첫 번째 열은 필요하지 않기 때문에,
[,-1]
로 제거합니다.)- 3개의 각 시계열을 시간 그래프(time plot)로 나타내봅시다.
autoplot(mytimeseries, facets=TRUE)
facets=TRUE
를 넣지 않으면 어떻게 되는지 확인해봅시다.월별 호주 소매 데이터를 책 웹사이트에서 내려받으시길 바랍니다. 이 파일은 호주 여러 주에서 기록된 다양한 물품의 소매 판매량을 담고 있고 엑셀(MS-Excel) 파일 형태로 되어있습니다.
다음과 같은 코드를 사용하여 R에서 데이터를 읽을 수 있습니다:
<- readxl::read_excel("retail.xlsx", skip=1) retaildata
두 번째 입력값(
skip=1
)은 엑셀의 시트에 두 개의 머리글(header) 행이 있기 때문에 필요합니다.시계열 중에서 하나를 다음과 같이 선택합니다(하지만 읽어들인 데이터의 열 이름을 여러분 자신이 선택한 열의 이름으로 교체하기 바랍니다: 왜냐하면 열의 이름이 매우 길고 복잡하기 때문입니다):
<- ts(retaildata[,"A3349873A"], myts frequency=12, start=c(1982,4))
다음과 같은 함수를 이용하여 여러분이 고른 소매 시계열을 살펴봅시다:
autoplot()
,ggseasonplot()
,ggsubseriesplot()
,gglagplot()
,ggAcf()
어떤 계절성, 주기성, 그리고 추세를 발견할 수 있습니까? 이 시계열에 관하여 무엇을 알 수 있습니까?
다음과 같은 시계열의 시간 그래프를 그려봅시다.
bicoal
,chicken
,dole
,usdeaths
,lynx
,goog
,writing
,fancy
,a10
,h02
.help()
를 사용하여 각 시계열에 있는 데이터를 살펴봅시다.goog
데이터를 그린 그래프의 제목과 축 라벨을 바꿔봅시다.
ggseasonplot()
과ggsubseriesplot()
함수를 사용하여 다음과 같은 시계열에서 계절성을 살펴봅시다:writing
,fancy
,a10
,h02
.- 계절성 패턴에 대해 어떤 이야기를 할 수 있겠습니까?
- 어떤 특이한 연도를 찾을 수 있겠습니까?
다음과 같은 그래픽 함수를 사용해봅시다:
autoplot()
,ggseasonplot()
,ggsubseriesplot()
,gglagplot()
,ggAcf()
그리고 다음과 같은 시계열에서 특징을 살펴봅시다:hsales
,usdeaths
,bricksq
,sunspotarea
,gasoline
.- 계절성, 주기성, 추세를 찾을 수 있습니까?
- 시계열에서 무엇을 알 수 있습니까?
arrivals
데이터 모음에는 분기별 일본, 뉴질랜드, 영국, 미국에서 호주로 들어오는 국제선 항공객(단위: 천) 정보가 있습니다.autoplot()
,ggseasonplot()
,ggsubseriesplot()
을 사용해보고, 이러한 4개국을 서로 비교해봅시다.- 어떤 특이한 관측값을 찾아낼 수 있습니까?
다음의 시계열 그래프와 ACF 그래프는 4개의 서로 다른 시계열과 대응됩니다. 두 번째 행의 ACF 그래프 중의 하나를 첫 번째 행의 각각의 시간 그래프(time plot)와 일치시켜봅시다.
pigs
데이터에는 1980년 1월부터 1995년 8월까지 호주 빅토리아주에서 매달 도축한 전체 돼지수 정보가 있습니다.mypigs <- window(pigs, start=1990)
을 사용하여 데이터를 1990년부터 선택해봅시다.mypigs
시계열에autoplot
과ggAcf
를 사용하고 그림 2.17 와 2.18 의 백색잡음 그래프와 비교해봅시다.dj
에는 292 연속 거래일 다우 존스 지수 데이터가 있습니다.ddj <- diff(dj)
를 사용하여 일별 지수 변화를 계산해봅시다.ddj
와ddj
의 ACF를 그려봅시다. 다우 존스 지수의 일별 변화가 백색잡음처럼 보입니까?