10.4 Trend di tipo deterministico e stocastico

Esistono due modi diversi per modellare un trend lineare. Un trend deterministico si ottiene utilizzando il modello di regressione \[ y_t = \beta_0 + \beta_1 t + \eta_t, \] dove \(\eta_t\) segue un processo ARMA. Un trend stocastico si ottiene invece usando il modello \[ y_t = \beta_0 + \beta_1 t + \eta_t, \] dove \(\eta_t\) segue un processo ARIMA con \(d=1\). In quest’ultimo caso, si possono differenziare entrambi i lati dell’equazione precedente in modo che \(y_t' = \beta_1 + \eta_t'\), dove \(\eta_t'\) segue un processo ARMA. In altre parole, \[ y_t = y_{t-1} + \beta_1 + \eta_t'. \] Questo è simile ad un random walk con drift (introdotto nel paragrafo 9.1), ma qui il termine di errore è un processo ARMA piuttosto che semplicemente rumore bianco.

Anche se questi modelli sembrano abbastanza simili (differiscono solo per il numero di differenze che devono essere applicate a \(\eta_t\)), le loro caratteristiche di previsione sono molto diverse.

Esempio: passeggeri del trasporto aereo in Australia

aus_airpassengers %>%
  autoplot(Passengers) +
  labs(x = "Anno", y = "Passeggeri (milioni)",
       title = "Totale annuo dei passeggeri aerei")
Totale annuo dei passeggeri (in milioni) per i vettori aerei australiani, 1970--2016.

Figura 10.9: Totale annuo dei passeggeri (in milioni) per i vettori aerei australiani, 1970–2016.

La figura 10.9 mostra il numero totale di passeggeri per i vettori aerei australiani ogni anno dal 1970 al 2016. Su questi dati si stimerà sia un modello con trend deterministico sia uno con trend stocastico.

Il modello con trend deterministico è ottenuto come segue:

fit_deterministic <- aus_airpassengers %>%
  model(deterministic = ARIMA(Passengers ~ 1 + trend() +
                                pdq(d = 0)))
report(fit_deterministic)
#> Series: Passengers 
#> Model: LM w/ ARIMA(1,0,0) errors 
#> 
#> Coefficients:
#>          ar1  trend()  intercept
#>       0.9564   1.4151     0.9014
#> s.e.  0.0362   0.1972     7.0751
#> 
#> sigma^2 estimated as 4.343:  log likelihood=-100.88
#> AIC=209.77   AICc=210.72   BIC=217.17

Questo modello può essere riscritto come \[\begin{align*} y_t &= 0.901 + 1.415 t + \eta_t \\ \eta_t &= 0.956 \eta_{t-1} + \varepsilon_t\\ \varepsilon_t &\sim \text{NID}(0,4.343). \end{align*}\]

La crescita stimata del numero di visitatori è 1.42 milioni di persone all’anno.

Alternativamente si può stimare il modello con trend stocastico.

fit_stochastic <- aus_airpassengers %>%
  model(stochastic = ARIMA(Passengers ~ pdq(d = 1)))
report(fit_stochastic)
#> Series: Passengers 
#> Model: ARIMA(0,1,0) w/ drift 
#> 
#> Coefficients:
#>       constant
#>         1.4191
#> s.e.    0.3014
#> 
#> sigma^2 estimated as 4.271:  log likelihood=-98.16
#> AIC=200.31   AICc=200.59   BIC=203.97

Questo modello può essere riscritto come \(y_t-y_{t-1} = 1.419 + \varepsilon_t\), o equivalentemente \[\begin{align*} y_t &= y_0 + 1.419 t + \eta_t \\ \eta_t &= \eta_{t-1} + \varepsilon_{t}\\ \varepsilon_t &\sim \text{NID}(0,4.271). \end{align*}\]

In questo caso, la crescita stimata del numero di visitatori è anche 1.42 milioni di persone all’anno. Anche se le stime di crescita sono simili, gli intervalli di previsione non lo sono, come mostra la figura 10.10. In particolare, i trend stocastici hanno intervalli di previsione molto più ampi perché gli errori non sono stazionari.

aus_airpassengers %>%
  autoplot(Passengers) +
  autolayer(fit_stochastic %>% forecast(h = 20),
    colour = "#0072B2", level = 95) +
  autolayer(fit_deterministic %>% forecast(h = 20),
    colour = "#D55E00", alpha = 0.65, level = 95) +
  labs(x = "Anno", y = "Passeggeri aerei (milioni)",
       title = "Previsioni da modelli con trend")
Previsioni dei passeggeri annuali per i vettori aerei australiani usando un modello con trend deterministico (linea arancione) ed un modello con trend stocastico (line blu).

Figura 10.10: Previsioni dei passeggeri annuali per i vettori aerei australiani usando un modello con trend deterministico (linea arancione) ed un modello con trend stocastico (line blu).

C’è un presupposto che implicitamente si adotta con i trend di tipo deterministico, ovvero che la pendenza della tendenza non cambierà nel tempo. D’altra parte invece, i trend stocastici possono cambiare, e la crescita stimata è solo assunta come la crescita media nel periodo storico, che non necessariamente coincide con il tasso di crescita che sarà osservato nel futuro. Di conseguenza, è più sicuro fare previsione utilizzando trend di tipo stocastico, specialmente per orizzonti di previsione più lunghi, poiché gli intervalli di previsione permettono una maggiore incertezza nella crescita futura.