8.6 Stima e selezione del modello

Stima dei modelli ETS

Un’alternativa alla stima dei parametri, effettuata minimizzando la somma degli errori al quadrato, è quella di massimizzare la “verosimiglianza”. La verosimiglianza è la probabilità che i dati derivino dal modello specificato. Perciò, una verosimiglianza elevata è associata ad un buon modello. Per un modello con errore additivo, massimizzare la verosimiglianza (assumendo errori normalmente distribuiti) porta agli stessi risultati che si ottengono con la minimizzazione della somma degli errori al quadrato. Si ottengono tuttavia risultati diversi per i modelli con errore moltiplicativo. In questo paragrafo, si stimano i parametri di lisciamento \(\alpha\), \(\beta\), \(\gamma\) e \(\phi\), e gli stati iniziali \(\ell_0\), \(b_0\), \(s_0,s_{-1},\dots,s_{-m+1}\), massimizzando la verosimiglianza.

I possibili valori che i parametri di lisciamento possono assumere sono limitati. Tradizionalmente, i parametri sono vincolati tra \(0\) e \(1\) in modo che le equazioni possano essere interpretate come medie ponderate. Cioè, \(0< \alpha,\beta^*,\gamma^*,\phi<1\). Per i modelli nello spazio degli stati, si è impostato \(\beta=\alpha\beta^*\) e \(\gamma=(1-\alpha)\gamma^*\). Pertanto, i tradizionali vincoli si traducono in \(0< \alpha <1\), \(0 < \beta < \alpha\) e \(0< \gamma < 1-\alpha\). In pratica, il parametro di smorzamento \(\phi\) è di solito vincolato ulteriormente per evitare difficoltà numeriche nella stima del modello. Nel pacchetto fable, esso è vincolato in modo che \(0.8<\phi<0.98\).

Un altro modo di interpretare i parametri è attraverso una considerazione delle proprietà matematiche dei modelli nello spazio degli stati. I parametri sono limitati per evitare che le osservazioni più lontane nel passato continuino ad avere effetto sulle previsioni attuali. Questo porta ad alcuni vincoli di ammissibilità sui parametri, che sono di solito (ma non sempre) meno restrittivi dei vincoli tradizionali (Hyndman et al., 2008, Cap. 10). Ad esempio, per il modello ETS(A,N,N), la regione di variazione dei parametri è \(0< \alpha <1\) ma la regione ammissibile è \(0< \alpha <2\). Per il modello ETS(A,A,N), la regione di variazione dei parametri è \(0<\alpha<1\) e \(0<\beta<\alpha\) ma la regione ammissibile è \(0<\alpha<2\) e \(0<\beta<4-2\alpha\).

Selezione del modello

Un grande vantaggio dei modelli statistici ETS è che per la selezione del modello si possono usare i criteri automatici di informazione. L’AIC, l’AIC\(_{\text{c}}\) e il BIC, introdotti nel paragrafo 7.5, possono essere usati qui per determinare quale dei modelli ETS è più appropriato per una data serie temporale.

Per i modelli ETS, il criterio di informazione di Akaike (AIC) è definito come \[ \text{AIC} = -2\log(L) + 2k, \] dove \(L\) è la versoimiglianza del modello e \(k\) è il numero totale di parametri e di stati iniziali che devono essere stimati (compresa la varianza dei residui).

L’AIC corretto per la distorsione in piccoli campioni (AIC\(_\text{c}\)) è definito come \[ \text{AIC}_{\text{c}} = \text{AIC} + \frac{2k(k+1)}{T-k-1}, \] ed il criterio di informazione bayesiano (Bayesian Information Criterion, BIC) è \[ \text{BIC} = \text{AIC} + k[\log(T)-2]. \]

Tre delle combinazioni di (Errore, Trend, Stagionalità) possono portare a difficoltà numeriche. In particolare, i modelli che possono causare tali instabilità sono ETS(A,N,M), ETS(A,A,M), e ETS(A,A\(_d\),M), a causa della divisione per valori potenzialmente vicini allo zero nelle equazioni di stato. Normalmente non si considerano queste particolari combinazioni quando si seleziona un modello.

I modelli con errori moltiplicativi sono utili quando i dati sono strettamente positivi, ma non sono numericamente stabili quando i dati contengono zeri o valori negativi. Pertanto, i modelli con errori moltiplicativi non saranno considerati se la serie temporale non è strettamente positiva. In questo caso, saranno applicati solo i sei modelli completamente additivi.

Esempio: Pernottamenti turistici interni per vacanza in Australia

Si utilizzano ora i modelli ETS per prevedere il turismo vacanziero australiano nel periodo 2016–2019. La funzione ETS() viene utilizzata per selezionare il modello minimizzando l’AICc.

aus_holidays <- tourism %>%
  filter(Purpose == "Holiday") %>%
  summarise(Trips = sum(Trips)/1e3)
fit <- aus_holidays %>%
  model(ETS(Trips))
report(fit)
#> Series: Trips 
#> Model: ETS(M,N,A) 
#>   Smoothing parameters:
#>     alpha = 0.3484 
#>     gamma = 1e-04 
#> 
#>   Initial states:
#>   l[0]    s[0]   s[-1]   s[-2] s[-3]
#>  9.727 -0.5376 -0.6884 -0.2934 1.519
#> 
#>   sigma^2:  0.0022
#> 
#>   AIC  AICc   BIC 
#> 226.2 227.8 242.9

Il modello selezionato è ETS(M,N,A) \[\begin{align*} y_{t} &= (\ell_{t-1}+s_{t-m})(1 + \varepsilon_t)\\ \ell_t &= \ell_{t-1} + \alpha(\ell_{t-1}+s_{t-m})\varepsilon_t\\ s_t &= s_{t-m} + \gamma(\ell_{t-1}+s_{t-m}) \varepsilon_t. \end{align*}\]

Le stime dei parametri sono \(\hat\alpha= 0.3484\), e \(\hat\gamma= 0.0001\). L’output restituisce anche le stime per gli stati iniziali \(\ell_0\), \(s_{0}\), \(s_{-1}\), \(s_{-2}\) e \(s_{-3}\). Si confrontino questi valori con quelli ottenuti per il metodo di Holt-Winters con stagionalità additiva presentati in tabella 8.3.

La figura 8.10 mostra gli stati nel tempo, mentre la figura 8.12 mostra le previsioni puntuali e gli intervalli di previsione generati dal modello. I piccoli valori di \(\gamma\) indicano che le componenti stagionali cambiano molto poco nel tempo.

components(fit) %>%
  autoplot() +
  labs(title = "Componenti di ETS(M,N,A)", x = "Trimestre")
Rappresentazione grafica degli stati stimati nel tempo.

Figura 8.10: Rappresentazione grafica degli stati stimati nel tempo.

Poiché questo modello ha errori moltiplicativi, i residui non sono equivalenti ai residui regolari (cioè agli errori di stima del training set un passo in avanti). In questo caso i residui sono dati da \(\hat{\varepsilon}_t\), mentre i residui regolari sono definiti come \(y_t - \hat{y}_{t|t-1}\). È possibile ottenere entrambi usando la funzione augment(). Essi sono rappresentati in figura 8.11.

Residui ed errori di previsione a un passo del modello ETS(M,N,A).

Figura 8.11: Residui ed errori di previsione a un passo del modello ETS(M,N,A).

Bibliografia

Hyndman, R. J., Koehler, A. B., Ord, J. K., & Snyder, R. D. (2008). Forecasting with exponential smoothing: The state space approach. Springer-Verlag. http://www.exponentialsmoothing.net