5.3 Valori stimati e residui

Valori stimati

Ogni osservazione in una serie storica può essere prevista utilizzando tutte le osservazioni precedenti. Ci si riferisce a questi come valori stimati e sono indicati con \(\hat{y}_{t|t-1}\), cioè la previsione di \(y_t\) basata sulle osservazioni \(y_{1},\dots,y_{t-1}\) . Spesso viene utilizzata una notazione semplificata omettendo parte del pedice e scrivendo solo \(\hat{y}_t\) invece di \(\hat{y}_{t|t-1}\). I valori stimati implicano quasi sempre previsioni un solo passo avanti (si veda però in merito il paragrafo 13.8).

In realtà, i valori stimati spesso non sono vere previsioni perché i parametri coinvolti nel metodo di previsione sono stimati utilizzando tutte le osservazioni disponibili nella serie temporale, comprese le osservazioni future. Per esempio, se si utilizza il metodo della media, i valori stimati sono dati da

\[ \hat{y}_t = \hat{c} \]

dove \(\hat{c}\) è la media calcolata su tutte le osservazioni disponibili, comprese quelle dei tempi dopo \(t\). Allo stesso modo, per il metodo con drift, il parametro del drift è stimato utilizzando tutte le osservazioni disponibili. In questo caso, i valori stimati sono dati da

\[ \hat{y}_t = y_{t-1} + \hat{c} \] dove \(\hat{c} = (y_T-y_1)/(T-1)\).

In entrambi i casi, c’è un parametro da stimare utilizzando i dati. Il “cappello” sopra il valore \(c\) indica che si tratta di una stima. Quando la stima di \(c\) coinvolge osservazioni successive al tempo \(t\), i valori stimati non sono vere previsioni. D’altra parte, le previsioni naive o naive stagionali non coinvolgono alcun parametro, e quindi i valori stimati in questi casi sono vere previsioni.

Residui

I “residui” in un modello per serie storiche sono ciò che rimane dopo la stima del modello. I residui sono uguali alla differenza tra le osservazioni e i valori stimati corrispondenti:

\[ e_{t} = y_{t}-\hat{y}_{t}. \]

Se è stata utilizzata una trasformazione nel modello, è spesso utile guardare i residui sulla scala trasformata. Chiamiamo questi “residui di innovazione”. Si supponga ad esempio di aver effettuato la trasformazione logaritmica dei dati, \(w_t = \log(y_t)\). Allora i residui di innovazione sono dati da \(w_t - \hat{w}_t\) mentre i residui riferiti ai dati originari sono dati da \(y_t - \hat{y}_t\). (Consultare il paragrafo 5.6 per come usare le trasformazioni quando si fa una previsione). Se non è stata utilizzata alcuna trasformazione, i residui di innovazione sono identici ai residui sui dati originari, e in questi casi ci si riferisce ad essi semplicemente come “residui”.

I valori stimati e i residui di un modello possono essere ottenuti usando la funzione augment(). Nell’esempio relativo alla produzione della birra nel paragrafo 5.2, i modelli stimati sono stati salvati nell’oggetto beer_fit. È perciò possibile applicare semplicemente augment() a questo oggetto per calcolare i valori stimati e i residui per tutti i modelli salvati.

augment(beer_fit)
#> # A tsibble: 180 x 6 [1Q]
#> # Key:       .model [3]
#>    .model Quarter  Beer .fitted .resid .innov
#>    <chr>    <qtr> <dbl>   <dbl>  <dbl>  <dbl>
#>  1 Mean   1992 Q1   443    436.   6.55   6.55
#>  2 Mean   1992 Q2   410    436. -26.4  -26.4 
#>  3 Mean   1992 Q3   420    436. -16.4  -16.4 
#>  4 Mean   1992 Q4   532    436.  95.6   95.6 
#>  5 Mean   1993 Q1   433    436.  -3.45  -3.45
#>  6 Mean   1993 Q2   421    436. -15.4  -15.4 
#>  7 Mean   1993 Q3   410    436. -26.4  -26.4 
#>  8 Mean   1993 Q4   512    436.  75.6   75.6 
#>  9 Mean   1994 Q1   449    436.  12.6   12.6 
#> 10 Mean   1994 Q2   381    436. -55.4  -55.4 
#> # ℹ 170 more rows

Ci sono tre nuove colonne che si aggiungono al dataset originale

  • .fitted contiene i valori stimati;
  • .resid contiene i residui;
  • .innov contiene i “residui di innovazione”, che in questo caso coincidono con i residui.

I residui sono utili per verificare se un modello ha catturato adeguatamente tutte le informazioni contenute nei dati. A questo scopo, si utilizzano i residui di innovazione.

Se nei residui di innovazione si osserva un qualche tipo di struttura o di comportamento, il modello può probabilmente essere migliorato. Nel prossimo paragrafo si presenteranno alcuni strumenti per verificare la presenza di queste strutture o comportamenti nei residui.