3.2 Componenti delle serie storiche

Se si ipotizza la presenza di una decomposizione additiva, allora è possibile suddividere una serie temporale come segue \[ y_{t} = S_{t} + T_{t} + R_t, \] dove \(y_{t}\) rappresenta la serie dei dati iniziali, \(S_{t}\) è la componente stagionale, \(T_{t}\) comprende il trend-ciclo ed \(R_t\) costituisce la parte residuale, tutte riferite al periodo \(t\). In alternativa, se si assume una decomposizione moltiplicativa la serie può essere scritta come \[ y_{t} = S_{t} \times T_{t} \times R_t. \]

La decomposizione additiva è più appropriata nel caso in cui l’ampiezza delle fluttuazioni stagionali, o la variabilità del trend-ciclo, non varia con il livello della serie storica. Quando invece la variabilità legata alla stagionalità, o alla componente trend-ciclo, ha un andamento proporzionale al livello della serie iniziale, allora una decomposizione moltiplicativa è più appropriata. Le decomposizioni moltiplicative sono comunemente utilizzate con serie di tipo economico.

Un’alternativa all’utilizzo di una decomposizione moltiplicativa consiste nell’utilizzo dapprima di una trasformazione, per ottenere una serie con una variabilità stabile nel tempo, per poi effettuare una decomposizione additiva. In particolare, quando si applica una trasformazione logaritmica, questo procedimento equivale ad usare una decomposizione moltiplicativa, in quanto \[ y_{t} = S_{t} \times T_{t} \times R_t \quad\text{corrisponde a}\quad \log y_{t} = \log S_{t} + \log T_{t} + \log R_t. \]

Esempio: Occupazione nel settore del commercio al dettaglio negli Stati Uniti

Nel seguito di questo capitolo saranno presentati diversi metodi per ottenere le componenti \(S_{t}\), \(T_{t}\) e \(R_{t}\), ma è utile prima mostrare un esempio pratico. Il numero di occupati nel commercio al dettaglio sarà decomposto come mostrato nella figura 3.5. I dati mostrano il numero mensile totale di persone (in migliaia) occupate nel settore della vendita al dettaglio negli Stati Uniti dal 1990.

us_retail_employment <- us_employment %>%
  filter(year(Month) >= 1990, Title == "Retail Trade") %>%
  select(-Series_ID)
autoplot(us_retail_employment, Employed) +
  labs(x = "Mese", y = "Persone (migliaia)",
       title = "Occupazione totale nella vendita al dettaglio negli Stati Uniti")
Totale degli impiegati nel settore della vendita al dettaglio negli Stati Uniti.

Figura 3.5: Totale degli impiegati nel settore della vendita al dettaglio negli Stati Uniti.

A scopo illustrativo, si fa uso qui del metodo di decomposizione STL che sarà discusso successivamente nel paragrafo 3.6.

dcmp <- us_retail_employment %>%
  model(stl = STL(Employed))
components(dcmp)
#> # A dable: 357 x 7 [1M]
#> # Key:     .model [1]
#> # :        Employed = trend + season_year + remainder
#>    .model    Month Employed  trend season_year remainder season_adjust
#>    <chr>     <mth>    <dbl>  <dbl>       <dbl>     <dbl>         <dbl>
#>  1 stl    1990 Jan   13256. 13288.      -33.0      0.836        13289.
#>  2 stl    1990 Feb   12966. 13269.     -258.     -44.6          13224.
#>  3 stl    1990 Mar   12938. 13250.     -290.     -22.1          13228.
#>  4 stl    1990 Apr   13012. 13231.     -220.       1.05         13232.
#>  5 stl    1990 May   13108. 13211.     -114.      11.3          13223.
#>  6 stl    1990 Jun   13183. 13192.      -24.3     15.5          13207.
#>  7 stl    1990 Jul   13170. 13172.      -23.2     21.6          13193.
#>  8 stl    1990 Aug   13160. 13151.       -9.52    17.8          13169.
#>  9 stl    1990 Sep   13113. 13131.      -39.5     22.0          13153.
#> 10 stl    1990 Oct   13185. 13110.       61.6     13.2          13124.
#> # ℹ 347 more rows

Il risultato appena ottenuto mostra le componenti di una decomposizione STL. I dati originari (Employed) sono affiancati dalle stime delle rispettive componenti. Il risultato del comando genera una tabella di tipo “dable” o tabella di decomposizione. L’intestazione della tabella mostra che la serie Employed è stata decomposta additivamente.

La colonna trend (che contiene la componente trend-ciclo \(T_t\)) segue l’andamento complessivo della serie, ignorando qualsiasi stagionalità e fluttuazione casuale, come mostrato in figura 3.6.

components(dcmp) %>%
  as_tsibble() %>%
  autoplot(Employed, colour="gray") +
  geom_line(aes(y=trend), colour = "#D55E00") +
  labs(
    x = "Mese", y = "Persone (migliaia)",
    title = "Occupazione totale nella vendita al dettaglio negli Stati Uniti" 
  )
Totale degli occupati nel settore della vendita al dettaglio negli Stati Uniti: componente trend-ciclo (arancione) e dati originari (grigio).

Figura 3.6: Totale degli occupati nel settore della vendita al dettaglio negli Stati Uniti: componente trend-ciclo (arancione) e dati originari (grigio).

Tutte le componenti possono essere visualizzate in un singolo grafico utilizzando la funzione autoplot(), come mostrato in figura 3.7.

components(dcmp) %>% autoplot()
Totale degli occupati nel settore della vendita al dettaglio negli Stati Uniti (pannello in alto) e le sue tre componenti additive.

Figura 3.7: Totale degli occupati nel settore della vendita al dettaglio negli Stati Uniti (pannello in alto) e le sue tre componenti additive.

Le tre componenti, mostrate separatamente nei tre pannelli inferiori, possono essere sommate per ricostruire i dati originari, mostrati nel pannello in alto. La componente stagionale cambia nel tempo e si può notare che, presi due anni consecutivi qualsiasi, questi presentano un andamento simile, mentre anni molto distanti tra loro possono avere una struttura diversa. La componente residuale mostrata nel pannello in basso rappresenta ciò che rimane quando le componenti stagionali e del trend-ciclo sono sottratte dai dati iniziali.

Le barre grigie a sinistra di ciascun pannello mostrano le scale relative delle componenti. Ogni barra grigia rappresenta la stessa lunghezza, ma poiché i grafici hanno scale diverse, le barre sono di diversa dimensione. La barra grigia nel pannello in basso mostra che la variabilità della componente residuale è più piccola rispetto alla variabilità complessiva. Se si riscalassero i grafici nei tre pannelli inferiori fino ad ottenere barre della stessa lunghezza di quelle del pannello dei dati iniziali, si otterrebbero grafici tutti sulla stessa scala.

Correzione stagionale dei dati

Quando la componente stagionale viene rimossa dai dati originari, i valori risultanti sono detti “destagionalizzati”. Per una decomposizione additiva, i dati destagionalizzati sono dati da \(y_{t}-S_{t}\), mentre nel caso moltiplicativo i valori destagionalizzati sono pari a \(y_{t}/S_{t}\).

La figura 3.8 mostra la serie destagionalizzata del numero degli occupati.

components(dcmp) %>%
  as_tsibble() %>%
  autoplot(Employed, colour = "gray") +
  geom_line(aes(y=season_adjust), colour = "#0072B2") +
  labs(x = "Mese", y = "Persone (migliaia)",
       title = "Occupazione totale nella vendita al dettaglio negli Stati Uniti" )
Dati destagionalizzati dell'occupazione (linea blu) e dati originari (linea grigia).

Figura 3.8: Dati destagionalizzati dell’occupazione (linea blu) e dati originari (linea grigia).

Le serie destagionalizzate sono utili nel caso in cui l’interesse primario dello studio non necessiti della presenza di fonti di variabilità dovute agli effetti stagionali. Per esempio, i dati mensili sulla disoccupazione sono di solito destagionalizzati allo scopo di enfatizzare le variazioni dovute al sistema economico sottostante piuttosto che quelle causate dagli effetti stagionali. Un aumento della disoccupazione dovuto agli studenti che completano il ciclo scolastico e sono alla ricerca di un lavoro è un esempio di variazione stagionale, mentre un aumento della disoccupazione dovuto ad una recessione economica non è stagionale. La maggior parte degli analisti economici che studiano i dati sulla disoccupazione sono interessati alle variazioni non stagionali. Di conseguenza, le serie storiche sull’occupazione (e molte altre serie economiche) sono solitamente destagionalizzate.

Le serie destagionalizzate contengono sia la componente residuale che la componente trend-ciclo. Per questo motivo tali serie non sono “lisce” e le “depressioni”, o le “crescite”, possono rivelarsi fuorvianti. Se lo scopo è quello di cercare i punti di svolta (detti anche turning points o change points) di una serie, ed interpretarne i cambiamenti di direzione, allora è meglio utilizzare la componente trend-ciclo piuttosto che i dati destagionalizzati.