서문

온라인 예측 교과서로 만나뵙게되어 반갑습니다.

이 교과서의 목적은 예측 기법을 종합적으로 소개하는 것과 읽는 사람이 기법을 적절하게 사용할 수 있도록 충분한 정보를 제공하는 것입니다. 각 기법의 이론적인 세부 사항은 각 장의 마지막에 첨부하는 참고문헌으로 대신하고 엄밀하게 다루지는 않으려고 합니다.

이 책은 주로 세 종류의 독자를 대상으로 합니다. (1) 예측 분야에서 체계적인 훈련을 받지 않았지만 경영 목적으로 예측을 하려는 사람. (2) 경영을 공부하는 학부생. (3) 예측 관련 과목을 수강하는 MBA 학생. 이 책은 호주의 모나쉬(Monash) 대학에서 상업 학사 학위(a Bachelor of Commerce degree) 과정을 밟는 2학년 학생이 듣는 과목의 교재입니다.

대부분의 절(section)에서, 독자가 고등학교 대수학(algebra)과 통계학 개론에 익숙하다는 것만 가정하고 있습니다. 몇몇 절에서는 행렬 관련 지식도 필요한데, 이 경우는 따로 표시하였습니다.

각 장의 마지막에 “더 읽을거리” 목록을 두었습니다. 이 목록의 대부분은 더 어렵거나 자세한 내용이 있는 교과서입니다. 적절한 교과서가 없는 경우에는, 더 자세한 내용을 담고 있는 논문으로 대신하였습니다.

이 책 전반에 걸쳐 R을 사용하니, R로 예측하는 방법을 익히길 바랍니다. R은 무료이고 거의 모든 운영 체제에서 사용할 수 있습니다. 단순히 예측만이 아니라, 모든 통계 분석을 위한 훌륭한 도구입니다. R을 설치하는 방법과 기본적인 사용법은 부록: R 사용하기 페이지를 참조하시길 바랍니다.

이 책의 모든 R 예제에서는 여러분이 fpp2 패키지를 사용하고 있다고 가정합니다. fpp2 패키지는 CRAN에서 받을 수 있고 library(fpp2)로 사용할 수 있습니다. 이 패키지는 forecastggplot2를 포함한 몇몇 다른 패키지와 이 책에서 사용하는 데이터를 자동으로 불러옵니다. 이 책을 준비하는 과정에서는 forecast 패키지 버전 v8.16과 fpp2 패키지 버전 v2.4을 사용했습니다. CRAN을 이용하여 이 패키지를 설치할 수 있습니다. 이 패키지의 이전 버전을 사용하면 이 책에서 보이는 것과 같이 결과가 나오지 않을 수 있습니다.

그림을 그릴 때 항상 ggplot2 패키지를 사용할 것입니다. 그래프를 수정하는 방법이나 이 책에 있는 예제와 다른 여러분만의 ggplot2 그림을 그리는 방법을 배우고 싶다면, ggplot2 책 (Wickham, 2016) 또는 온라인 교육 플랫폼인 데이터캠프(DataCamp)의 ggplot2 코스를 참조하길 바랍니다.

이 책을 가지고 진행하는 데이터캠프(DataCamp) 코스도 있습니다. 이 강의에서는 2, 3, 7, 8 장의 몇몇 내용을 소개하고 9, 11장의 몇 가지 주제를 간단하게 다룹니다.

이 책은 몇 가지 측면에서 기존의 예측 교과서와 다릅니다.

  • 폭넓은 독자층이 볼 수 있도록 온라인에서 무료로 볼 수 있게 하였습니다.
  • 무료이고, 오픈소스이며, 엄청나게 강력한 소프트웨어인 R을 사용합니다.
  • 온라인 판은 꾸준하게 개정됩니다. 잘못된 부분 교정이나 새로운 기법 설명 때문에 다음 판을 기다릴 필요가 없습니다. 우리는 이 책을 자주 개정할 것입니다.
  • 우리가 컨설팅 작업에서 사용했던 많은 실제 데이터 예제를 담고 있습니다. 수백개의 회사나 단체와 일하며, 예측 관련 문제를 해결하는데 도움을 주었고, 이러한 경험과 예측할 때 사용하는 일반적인 원칙을 이 책에 첨부한 많은 예제에 직접 담았습니다.
  • 대부분의 경우에 예측기법 자체보다는 시각적인 기법을 강조하였습니다. 데이터를 살피고, 모델의 타당성을 분석하고 예측 결과를 나타낼 때 그래프를 사용하였습니다.

2판에서 달라진 부분

2판에서 가장 중요한 변화는 시계열 예측에 초점을 맞췄다는 것입니다. 즉, 횡단면적 예측 문제(cross-sectional prediction)를 더이상 다루지 않습니다. 대신, 이 책에서는 과거에 수집한 관측값으로 미래 시점의 데이터를 예측하는 문제를 다룹니다.

지수 평활 관련 장을 간략하게 다듬었고, 동적회귀(dynamic regression)와 계층적 예측(hierarchical forecasting) 그리고 실제적인 예측 문제를 다루는 새로운 장을 추가하였습니다. 예측값을 결합하는 방법, 복잡한 계절성 패턴을 다루는 방법, 시간별, 일별, 주별 데이터를 다루는 방법, 계수 시계열(count time series) 예측을 다루는 새로운 절, 그리고 다양한 새로운 예제를 추가하였습니다. 기존의 모든 장을 최신 연구 결과를 반영하여 개정하였고, 가능한 더 나은 설명, 더 새로운 참고 문헌, 더 많은 예제 등을 포함하고 R 코드를 간결하게 하기 위해 모든 장을 주의깊게 검토하였습니다.

이 책의 초기 버전의 발견하신 오탈자를 몇몇 독자분이 저희에게 기꺼이 알려주셨습니다. 온라인에서 즉시 갱신하였고 이러한 모든 교정을 통해 인쇄본이 나올 수 있었습니다. 몇몇 새로운 실수가 없다고 생각하지 않으니 발견 후 알려주시면 바로 수정하도록 하겠습니다. 이러한 부분을 발견하시면 저희에게 계속 알려주시길 바랍니다.

이 책에서 다룬 R 패키지 사용법에 관한 질문이 있거나, 예측 전반에 대한 질문이 있으면, RStudio 커뮤니티 웹사이트에서 질문 주시길 바랍니다.  

즐거운 예측 작업이 되길 바라며!

롭 힌드만(Rob J Hyndman)과 조지 아타나소풀로스(George Athanasopoulos)

2018년 4월


이 책의 온라인 판을 인용할 때는 아래와 같이 하시길 바랍니다:

Hyndman, R.J., & Athanasopoulos, G. (2018) Forecasting: principles and practice, 2nd edition, OTexts: Melbourne, Australia. OTexts.com/fpp2. Accessed on <current date>.

 

이 책의 온라인 판은 10 September 2022에 마지막으로 업데이트하였습니다.
이 책의 인쇄본은 (영문 원서를 아마존(Amazon)과 구글(Google)에서 구입할 수 있습니다) 2018년 5월 8일에 마지막으로 업데이트하였습니다.


옮긴이 서문

먼저, 영어로 된 2판 원서를 한글로 옮기는 것을 기꺼이 허락해주신 원 저자 두 분께 감사의 말씀을 드립니다. 2017년 1월 롭 힌드만(Rob J Hyndman) 교수님의 깃헙(GitHub) 저장소에서 포크(fork)하여 한글로 옮기기를 시작한 것이 드디어 빛을 봅니다. 원서의 온라인판은 2018년 4월에 공개되었고 인쇄본은 2018년 5월에 공개되었으나, 한글판은 옮긴이의 게으름으로 2019년 2월이 되어서야 온라인에 공개하게 되었습니다. 업무와 번역 작업을 병행하는 것이 정말 쉽지 않았다는 것은 핑계 같지만, 그래도 끝을 보게되어 뿌듯합니다.

읽으시다가 맞춤법에 맞지 않는 표현을 발견하시거나 잘못 옮긴 부분 또는 어색한 부분이 있으면 언제든지 알려주시길 부탁드립니다.

특별히 한국통계학회 용어집을 추천해주시고 애매한 표현이 있을 때 조언해주신 모나쉬(Monash) 대학의 구본수(Bonsoo Koo) 교수님께 감사드립니다.

수학적인 의미를 더 잘 전달하는 표현 및 더 자연스러운 우리말 표현 등을 자발적으로 제안하여 주신 신중훈 님께 감사드립니다.

오탈자를 교정해주신 한국전자통신연구원 선임연구원 최종우 님과 김가영 님께 감사드립니다.

빠진 수식을 교정해주신 김재정 님께 감사드립니다.

옮기는 과정에서 생긴 수식 오류를 발견하여 알려주신 KAIST 물리학과 석박사통합과정 이상윤 님께 감사드립니다.

이 모든 분의 기여 덕분에 미처 챙기지 못했던 부족한 부분을 보완할 수 있었습니다.

2019년 2월

김영호

참고 문헌

Wickham, H. (2016). ggplot2: Elegant graphics for data analysis (2nd ed). Springer. [Amazon]