6.7 趋势性和季节性的程度测定

时间序列分解可以用来测定时间序列的趋势性和季节性(Wang, Smith, & Hyndman, 2006),其分解式为: \[ y_t = T_t + S_{t} + R_t, \] 其中 \(T_t\) 表示平滑后的趋势项,\(S_{t}\) 表示季节项,\(R_t\) 表示残差项。对于趋势性很强的数据,经季节调整后的数据应比残差项的变动幅度更大。因此,\(Var(R_t)/Var(T_t+R_t)\) 会相对较小。但是,对于没有趋势或是趋势很弱的时间序列,两个方差应大致相同。因此,我们将趋势强度定义为:

\[ F_T = \max\left(0, 1 - \frac{\text{Var}(R_t)}{\text{Var}(T_t+R_t)}\right). \]

这可以给趋势强度的衡量标准,其值在 0-1 之间。因为有些情况下残差项的方差甚至比季节变换后的序列还大,我们令 \(F_T\) 可取的最小值为0。

相似地,季节性的强度定义如下,其所用的数据为去除趋势后的数据而不是季节调整后的数据。 \[ F_S = \max\left(0, 1 - \frac{\text{Var}(R_t)}{\text{Var}(S_{t}+R_t)}\right). \] 当季节强度 \(F_S\) 接近 0 时表示该序列几乎没有季节性,当季节强度 \(F_S\) 接近 1 时表示该序列的 Var\((R_t)\)远小于 Var\((S_{t}+R_t)\)

这些度量方法非常实用,例如当你需要在很多时间序列中找到趋势性或季节性最强的序列,就可以使用这个方法。

参考文献

Wang, X., Smith, K. A., & Hyndman, R. J. (2006). Characteristic-based clustering for time series data. Data Mining and Knowledge Discovery, 13(3), 335–364. https://robjhyndman.com/publications/ts-clustering/