9.8 Previsioni

Previsioni puntuali

Sebbene, nel nostro esempio, abbiamo calcolato le previsioni dai modelli ARIMA, non abbiamo ancora spiegato come si ottengono. Le previsioni puntuali possono essere calcolate usando i seguenti tre passi.

  1. Riscrivere l’equazione del modello ARIMA in modo tale che \(y_t\) sia dalla parte sinistra e tutti glia ltri termini sulla destra.
  2. Riscrivere l’equazione sostituendo \(t\) con \(T+h\).
  3. Sulla parte destra dell’equazione, sostituire le osservazioni future con la loro previsione, gli errori futuri con zero, e gli errori passati con i corrispondenti residui.

Iniziando con \(h=1\), questi passi devono essere ripetuti per \(h=2,3,\dots\) fino a che tutte le previsioni vengono calcolate.

La procedura è più facilmente comprensibile se la illustriamo con un esempio. Utilizziamo un modello ARIMA(3,1,1) che può essere riscritto come segue:

\[ (1-\hat{\phi}_1B -\hat{\phi}_2B^2-\hat{\phi}_3B^3)(1-B) y_t = (1+\hat{\theta}_1B)\varepsilon_{t}. \] Quindi sviluppiamo la parte sinistra per ottenere \[ \left[1-(1+\hat{\phi}_1)B +(\hat{\phi}_1-\hat{\phi}_2)B^2 + (\hat{\phi}_2-\hat{\phi}_3)B^3 +\hat{\phi}_3B^4\right] y_t = (1+\hat{\theta}_1B)\varepsilon_{t}, \] e applicando l’operatore ritardo otteniamo \[ y_t - (1+\hat{\phi}_1)y_{t-1} +(\hat{\phi}_1-\hat{\phi}_2)y_{t-2} + (\hat{\phi}_2-\hat{\phi}_3)y_{t-3} +\hat{\phi}_3y_{t-4} = \varepsilon_t+\hat{\theta}_1\varepsilon_{t-1}. \] Infine, spostiamo tutti i termini diversi da \(y_t\) sulla parte destra dell’equazione: \[\begin{equation} \tag{9.5} y_t = (1+\hat{\phi}_1)y_{t-1} -(\hat{\phi}_1-\hat{\phi}_2)y_{t-2} - (\hat{\phi}_2-\hat{\phi}_3)y_{t-3} -\hat{\phi}_3y_{t-4} + \varepsilon_t+\hat{\theta}_1\varepsilon_{t-1}. \end{equation}\] Questo completa il primo passo. Anche se l’equazione ora sembra quella di un modello ARIMA(4,0,1), è ancora lo stesso modello ARIMA(3,1,1) con cui abbiamo iniziato. Non può essere considerato un ARIMA(4,0,1) perché i coefficienti non soddisfano le condizioni di stazionarietà.

Per il seondo passo, sostituiamo \(t\) con \(T+1\) in (9.5): \[ y_{T+1} = (1+\hat{\phi}_1)y_{T} -(\hat{\phi}_1-\hat{\phi}_2)y_{T-1} - (\hat{\phi}_2-\hat{\phi}_3)y_{T-2} -\hat{\phi}_3y_{T-3} + \varepsilon_{T+1}+\hat{\theta}_1\varepsilon_{T}. \] Assumendo di avere osservazioni fino al tempo \(T\), tutti i valori sulla parte destra dell’equazione sono noti ad eccezione di \(\varepsilon_{T+1}\), che sostituiamo con zero, e \(\varepsilon_T\), che sostituiamo con l’ultimo residuo stimato \(e_T\): \[ \hat{y}_{T+1|T} = (1+\hat{\phi}_1)y_{T} -(\hat{\phi}_1-\hat{\phi}_2)y_{T-1} - (\hat{\phi}_2-\hat{\phi}_3)y_{T-2} -\hat{\phi}_3y_{T-3} + \hat{\theta}_1e_{T}. \]

La previsione di \(y_{T+2}\) si ottiene sostituendo \(t\) con \(T+2\) in (9.5) . Tutti i valori sulla parte destra dell’equazione sono noti al tempo \(T\) eccetto \(y_{T+1}\) che sostituiamo con \(\hat{y}_{T+1|T}\), e \(\varepsilon_{T+2}\) e \(\varepsilon_{T+1}\), entrambi sostituiti con zero: \[ \hat{y}_{T+2|T} = (1+\hat{\phi}_1)\hat{y}_{T+1|T} -(\hat{\phi}_1-\hat{\phi}_2)y_{T} - (\hat{\phi}_2-\hat{\phi}_3)y_{T-1} -\hat{\phi}_3y_{T-2}. \]

Il processo di previsione continua in questo modo per tutti i passi di previsione. In questo modo, possiamo ottenere una previsione puntuale per qualsiasi valore futuro.

Intervalli di previsione

Il calcolo di intervalli di previsione per modelli ARIMA è più complicato, e i dettagli sono ben oltre lo scopo di questo libro. Qui daremo solo qualche semplice esempio.

Il primo intervallo di previsione è facile da calcolare. Se \(\hat{\sigma}\) è la deviazione standard dei residui, allora un intervallo di previsione al 95% è dato da \(\hat{y}_{T+1|T} \pm 1.96\hat{\sigma}\). Questo risultato è vero per tutti i modelli ARIMA indipendentemente dall’ordine del modello e dal valore di parametri.

Intervalli di previsione a più passi per modelli ARIMA(0,0,\(q\)) sono relativamente facoli da calcolare. Possiamo scrivere il modello come \[ y_t = \varepsilon_t + \sum_{i=1}^q \theta_i \varepsilon_{t-i}. \] Pertanto, la varianza di previsione stimata può essere scritta come \[ \hat\sigma_h^2 = \hat{\sigma}^2 \left[ 1 + \sum_{i=1}^{h-1} \hat{\theta}_i^2\right], \qquad\text{per $h=2,3,\dots$,} \] e un intervallo di previsione al 95% è dato da \(\hat{y}_{T+h|T} \pm 1.96\hat\sigma_h\).

Nella Sezione 9.4, abbiamo mostrato che un modello AR(1) può essere riscritto come un modello MA(\(\infty\)). Usando questa equivalenza, il precedente risultato, valido per modelli MA(\(q\)), può essere utilizzato per ottenere intervalli di previsione anche per modelli AR(1).

Risultati più generali, e intervalli di previsione a più passi per modelli ARIMA(\(p,d,q\)), sono riportati in libri di testo più avanzati come, per esempio, Brockwell & Davis (2016).

Gli intervalli di previsione per i modelli ARIMA si basano sull’assunzione che i residui siano non correlati e normalmente distribuiti. Se una di queste ipotesi non è valida, gli intervalli di previsione possono non essere corretti. Per questo motivo, è importante rappresentare sempre l’ACF e l’istogramma dei residui per verificare tali ipotesi prima di calcolare gli intervalli di previsione.

Se i residui sono incorrelati, ma non norlmamente distribuiti, allora si possono ottenere degli intervalli di previsione usando il bootstrap, come discusso nella Sezione 5.5. Questo si può fare facilmente aggiungendo bootstrap=TRUE nella funzione forecast().

In generale, l’ampiezza degli intervalli di previsione per i modelli ARIMA aumenta all’aumentare dell’orizzonte di previsione. Per i modelli stazionari (cioè con \(d=0\)) l’ampiezza diventa costante, così che gli intervalli di previsione per orizzonti lunghi sono tutti essenzialmente uguali. Per \(d=1\), invece, l’ampiezza degli intervalli di previsione continua a crescere nel futuro.

Come per la maggior parte degli intervalli di previsione, quelli basati sui modelli ARIMA tendono ad essere troppo stretti. Questo si verifica, perché, nel calcolarli, si tiene conto solo della variabilità dovuta agli errori. In realtà, bisognerebbe tener conto anche della variabilità dovuta alle stime dei parametrie all’ordine del modello. Inoltre, il calcolo degli intervalli di previsione presuppone che il modello ARIMA adattato alla serie storica continui a valere anche nel periodo di previsione.

Bibliografia

Brockwell, P. J., & Davis, R. A. (2016). Introduction to time series and forecasting (3rd ed). Springer. [Amazon]