1.6 予測業務の基本的なステップ

予測業務には5つの基本的なステップが通常あります。

ステップ 1: 問題定義
このステップが予測のプロセスの中で最も困難な部分であることがしばしばあります。慎重に問題を定義するには、予測がどう使われるのか、誰が予測を必要としているのか、予測を求める組織の中に予測機能がどう当てはまるのか、を理解する必要があります。データ収集、データベース保守、将来計画のための予測使用などに携わる全員と、予測者は時間を費やして話しをする必要があります。
ステップ 2: 情報収集
いつも最低でも2種類の情報が必要になります。(a) 統計データと(b) データ収集者や予測使用者に蓄積された専門知識です。良い統計モデルを推計するのに必要なだけの過去データを得られないことがよくあります。そうした場合、6章の判断的予測手法が使えます。予測対象のシステムに構造変化が生じたため、古いデータの有用性が低下していることもあります。その場合、最近のデータだけを使うことになるかもしれません。ただ、良い統計モデルはシステム内の進化的変化を扱えることを思い出してください。不必要に良いデータを捨てることがないようにしましょう。
ステップ 3: (探索的)予備分析
つねにデータをグラフにすることから始めましょう。一貫したパターンはないか? 目につくトレンドはないか? 季節性は顕著か? 景気循環が存在する証拠はないか? 専門知識を持つ人に説明してもらう必要がある外れ値はないか? 分析に利用可能な変数間の関係性はどれだけ強いか? こうした分析を助けるために開発された道具がさまざまあります。これらについては、2章と3章で議論します。
ステップ 4: モデル選択と当てはめ
過去データの入手可能性、予測対象変数と説明変数間の関係性の強さ、予測の使用方法によって、使用する最適なモデルが決まってきます。可能性のある2、3のモデルを比較するのはよくあることです。モデル自体はそれぞれ、一群の(暗黙であれ明示であれ)前提に基づく人工構築物で、既知の過去データを用いて推定する必要のある1つかそれ以上のパラメータを通常含んでいます。本書では、回帰モデル(7章)、指数平滑化モデル(8章)、Box-Jenkins ARIMA モデル(9章)、動学回帰モデル( 10章), 階層型モデル(11章)、そして、ニューラルネットワークやベクトル自己回帰を含む先端的手法(12章)を議論します。
ステップ 5: 予測モデルの使用と評価
いったんモデルを選択しそのパラメータを推定すれば、モデルを使って予測を生成できます。モデルの実力を適切に評価できるのは、予測期間の実績値が入手可能になってからです。予測の正確さを評価する助けとして開発された手法がいくつかあります。予測の使用と予測に基づく行動には組織的課題もあります。これらの課題のいくつかは、5章で軽く議論します。実務において予測モデルを使用する際は、欠損値や外れ値の扱い、短い時系列の扱いなど、いくつも実務的な課題が出てきます。これらは13章で議論します。