1.5 案例

以下四个案例均来自我们的实践工作,展示了不同类型的预测情况以及经常出现的相关问题。

案例1

研究对象是一家生产餐巾纸和纸盘等一次性餐具的大型公司。他们每个月都需要对数百种产品进行预测。时间序列数据显示出一系列模式,其中一些带有长期趋势,一些带有季节变动,还有一些两者都不具备。当时,他们正在使用公司内部编写的软件进行预测,但得到的预测结果并不合理。他们使用的方法如下:

  1. 取过去12个月数据的平均值;
  2. 取过去6个月数据的平均值;
  3. 根据过去12个月数据拟合的直线回归进行预测;
  4. 根据过去6个月数据拟合的直线回归进行预测;
  5. 根据最后一次观测值和相应斜率得到的直线进行预测,其斜率等于今年观测值与去年对应月份观测值连线的平均斜率;
  6. 根据最后一次观测值和相应斜率得到的直线进行预测,其斜率等于今年最近6个月观测值与去年对应月份观测值连线的平均斜率。

他们要求我们找到问题所在,并对软件进行修改以提供更准确的预测。由于该软件是用COBOL进行编写的,因此很难进行任何复杂的数值计算。

案例2

在这个案例中,服务对象是澳大利亚联邦政府,他们需要对药品津贴计划(PBS)的年度预算进行预测。药品津贴计划对在澳大利亚销售的多种医药产品提供补贴,且该项政府支出取决于人们在当年购买的药品种类。2009年药品津贴计划总支出约为70亿澳元,在我们协助制定更准确的预测方法之前的两年中,每年的总支出都低估了近10亿澳元。

为了预测药品津贴计划的总支出,我们首先需要根据月度数据对数百种药品的销售量进行预测。几乎每种药品的销售量数据都包含长期趋势和季节变动模式。很多药品的销量会因药品补贴政策的变化而突然上升或下降,对很多药品的津贴支出也会因出现低价可替代药品而突然发生变化。

因此,我们需要寻找到一种能够对包含长期趋势和季节变动因素的数据进行预测的方法,使得该方法不仅可以对潜在模式下的突然变动进行稳健预测,同时能够处理大样本的时间序列数据。

案例3

一家大型汽车公司要求我们帮助他们预测汽车转售价格,他们将购入的新车对外出租三年后再次售出。更好的对汽车销售价格进行预测就意味着更多的利润。因此,找到影响汽车转售价格的因素可能会优化租赁和销售政策,从而实现利润最大化。

当时,一群专家正在预测汽车转售价格。他们认为统计模型的建立会对他们的生计造成威胁,因而在提供信息方面不合作。尽管如此,该公司还是给我们提供了大量的车辆和汽车转售价格的历史数据。

案例4

在这个项目中,我们需要开发一个模型来预测澳大利亚主要航空公司的主要国内航线的周航空客运量。该公司要求对各主要国内航线及各类乘客(经济舱、商务舱和头等舱)的人数进行预测并向我们提供了前6年的航线周历史数据。

航空乘客人数会受到学校假期、重大体育赛事、广告活动、竞争行为等影响。一般情况下,澳大利亚不同城市的学校假期不会同时出现,体育赛事有时也会从一个城市转移到另一个城市。在历史数据相应期间发生过一场关键飞行员的罢工运动,其间几个月都没有相关航线运行,一条新的低价航线推出后也惨遭失败。在历史数据期间的末尾,航空公司将一些经济舱座位重新改造为商务舱和头等舱座位,然而几个月后,座位安排重新恢复到原来的状态。