Capitolo 10 Modelli di regressione dinamica

I modelli di regressione dinamica trattati nei due capitoli precedenti permettono l’inclusione di informazioni dalle osservazioni passate di una serie storica, ma non l’inclusione di altre informazioni che possono essere rilevanti. Per esempio, gli effetti delle vacanze, l’attività dei concorrenti, i cambiamenti nella legge, l’economia in generale, o altre variabili esterne, possono spiegare parte della variazione storica e possono portare a previsioni più accurate. D’altra parte, i modelli di regressione visti nel Capitolo 7 permettono l’inclusione di molte informazioni rilevanti ottenute dalle variabili predittive, ma non consentono di tener conto delle dinamiche delle serie temporali che possono essere gestite con i modelli ARIMA. In questo capitolo, si mostra come estendere i modelli ARIMA per permettere l’inclusione di altre informazioni nei modelli.

Nel capitolo 7 sono stati considerati modelli di regressione della forma \[ y_t = \beta_0 + \beta_1 x_{1,t} + \dots + \beta_k x_{k,t} + \varepsilon_t, \] dove \(y_t\) è una funzione lineare delle \(k\) variabili predittive (\(x_{1,t},\dots,x_{k,t}\)), e solitamente si assume \(\varepsilon_t\) come un termine di errore non correlato (vale a dire white noise, o rumore bianco). Sono stati poi illustrati test statistici come il test di Ljung-Box per valutare se i residui risultanti fossero significativamente correlati.

In questo capitolo, si rilasseranno i vincoli imposti permettendo che gli errori della regressione siano autocorrelati. Per sottolineare questo cambiamento di prospettiva, si sostituirà \(\varepsilon_t\) con \(\eta_t\) nell’equazione precedente. Si presume che la serie di errori \(\eta_t\) segua un modello ARIMA. Per esempio, se \(\eta_t\) segue un modello ARIMA(1,1,1), si può scrivere \[\begin{align*} y_t &= \beta_0 + \beta_1 x_{1,t} + \dots + \beta_k x_{k,t} + \eta_t,\\ & (1-\phi_1B)(1-B)\eta_t = (1+\theta_1B)\varepsilon_t, \end{align*}\] dove \(\varepsilon_t\) è una serie storica white noise.

Da notare qui che il modello ha due termini di errore — l’errore del modello di regressione, indicato con \(\eta_t\), e l’errore del modello ARIMA, indicato con \(\varepsilon_t\). Solo gli errori del modello ARIMA sono assunti come rumore bianco.