3.5 Metodi utilizzati dagli Istituti ufficiali di statistica

Gli istituti ufficiali di statistica (come il Census Bureau degli Stati Uniti, l’Australian Bureau of Statistics e l’ISTAT in Italia) sono responsabili della produzione di un gran numero di serie storiche ufficiali di carattere economico e sociale. Queste agenzie hanno sviluppato le proprie procedure di decomposizione che vengono utilizzate per la destagionalizzazione. La maggior parte utilizza varianti del metodo X-11, del metodo SEATS, oppure una combinazione dei due. Questi metodi sono progettati specificamente per essere applicati su dati trimestrali e mensili, dato che queste sono le serie più comuni gestite dalle agenzie statistiche ufficiali. Tali istituti solitamente non trattano stagionalità di altri tipi, come dati settimanali, giornalieri, oppure orari. In questo paragrafo sarà introdotta l’ultima implementazione di questa classe di metodi, conosciuta come “X-13ARIMA-SEATS”. Per i metodi discussi in questo paragrafo, è necessario installare il package R seasonal.

Il metodo X-11

Il metodo X-11 ha avuto origine nell’US Census Bureau ed è stato successivamente sviluppato da Statistics Canada. Il metodo si basa sulla decomposizione classica, ma include molti passi aggiuntivi per permettere di superare gli svantaggi della decomposizione classica stessa discussi nel paragrafo precedente. In particolare, le stime della componente trend-ciclo sono disponibili per tutte le osservazioni (compresi i valori iniziali e finali della serie) e la componente stagionale può subire piccole variazioni nel tempo. Inoltre, X-11 considera anche la variabilità dovuta agli effetti di calendario come, ad esempio, i giorni lavorativi, i giorni di vacanza e gli effetti di altri predittori noti. Sono disponibili metodi di decomposizione sia di tipo additivo che moltiplicativo. La procedura nel suo complesso è interamente automatica e tende ad essere molto robusta rispetto alla presenza di valori anomali e di cambi di livello (level shifts) nelle serie storiche. I dettagli della procedura X-11 sono descritti in Dagum & Bianconcini (2016).

x11_dcmp <- us_retail_employment %>%
  model(x11 = X_13ARIMA_SEATS(Employed ~ x11())) %>%
  components()
autoplot(x11_dcmp) +
  labs(title =
    "Decomposizione dell'occupazione totale nella vendita al dettaglio
    negli Stati Uniti utilizzando X-11")
Decomposizione moltiplicativa degli occupati nel settore della vendita al dettaglio negli Stati Uniti utilizzando la procedura X-11.

Figura 3.14: Decomposizione moltiplicativa degli occupati nel settore della vendita al dettaglio negli Stati Uniti utilizzando la procedura X-11.

Si confronti questa decomposizione con la decomposizione STL mostrata in figura 3.7 e con la decomposizione classica illustrata in figura 3.13. La componente trend-ciclo ottenuta con X-11 riesce a catturare meglio la caduta improvvisa della serie (dovuta alla crisi finanziaria globale del 2007–2008) rispetto agli altri due metodi (dove l’effetto della crisi è confluito nella componente residuale). Inoltre, il valore anomalo presente nell’anno 1996 è adesso più evidente all’interno della componente residuale generata con la procedura X-11.

In figura 3.15 sono illustrate, unitamente ai dati originari, la componente trend-ciclo ed i dati destagionalizzati. In questo esempio i dati destagionalizzati hanno un andamento molto simile a quello della componente trend-ciclo, per cui non è facile distinguere le due componenti basandosi solo sul grafico.

x11_dcmp %>%
  ggplot(aes(x = Month)) +
  geom_line(aes(y = Employed, colour = "Data")) +
  geom_line(aes(y = season_adjust,
                colour = "Seasonally Adjusted")) +
  geom_line(aes(y = trend, colour = "Trend")) +
  labs(y = "Persone (migliaia)",
       title = "Occupazione totale nella vendita al dettaglio negli Stati Uniti") +
  scale_colour_manual(
    values = c("gray", "#0072B2", "#D55E00"),
    breaks = c("Data", "Seasonally Adjusted", "Trend")
  )
Occupazione nella vendita al dettaglio negli Stati Uniti: dati originari (linea grigia), componente trend-ciclo (linea arancione)  e dati destagionalizzati (linea blu, scarsamente visibile).

Figura 3.15: Occupazione nella vendita al dettaglio negli Stati Uniti: dati originari (linea grigia), componente trend-ciclo (linea arancione) e dati destagionalizzati (linea blu, scarsamente visibile).

Può risultare utile utilizzare i grafici stagionali e i grafici di sotto-serie stagionali al fine di evidenziare (a livello empirico) la presenza di variazioni della componente stagionale nel tempo. La figura 3.16 mostra un grafico illustrativo delle sotto-serie stagionali per la componente stagionale presentata in figura 3.14. In questo caso si evincono solo piccole variazioni nel tempo.

x11_dcmp %>%
  gg_subseries(seasonal)
Rappresentazione grafica delle sotto-serie stagionali per la componente stagionale ricavata con X-11, relativa all'occupazione totale nella vendita al dettaglio negli Stati Uniti.

Figura 3.16: Rappresentazione grafica delle sotto-serie stagionali per la componente stagionale ricavata con X-11, relativa all’occupazione totale nella vendita al dettaglio negli Stati Uniti.

Il metodo SEATS

“SEATS” è un acronimo derivato dal termine inglese Seasonal Extraction in ARIMA Time Series (i modelli ARIMA sono trattati nel Capitolo 9). Questa procedura è stata sviluppata presso la Banca di Spagna ed è ora ampiamente utilizzata dalle agenzie governative di tutto il mondo. I dettagli tecnici di questa procedura vanno oltre lo scopo di questo libro. Una discussione approfondita è disponibile in Dagum & Bianconcini (2016).

seats_dcmp <- us_retail_employment %>%
  model(seats = X_13ARIMA_SEATS(Employed ~ seats())) %>%
  components()
autoplot(seats_dcmp) +
  labs(title =
    "Decomposizione dell'occupazione totale nella vendita al dettaglio negli Stati Uniti
    utilizzando SEATS",
    x = "Mese")
Decomposizione degli occupati nel settore della vendita al dettaglio negli Stati Uniti utilizzando la procedura SEATS.

Figura 3.17: Decomposizione degli occupati nel settore della vendita al dettaglio negli Stati Uniti utilizzando la procedura SEATS.

La figura 3.17 illustra l’applicazione del metodo SEATS alla serie storica dell’occupazione totale nella vendita al dettaglio negli Stati Uniti. Il risultato ottenuto è simile a quello ottenuto utilizzando il metodo X-11 mostrato in figura 3.14.

La funzione X_13ARIMA_SEATS() è disponibile nel package seasonal, il quale propone molte opzioni per gestire le varianti offerte dalle procedure X-11 e SEATS. Per un’introduzione dettagliata alle opzioni ed alle caratteristiche disponibili si consiglia di consultare il sito del package.

Bibliografia

Dagum, E. B., & Bianconcini, S. (2016). Seasonal adjustment methods and real time trend-cycle estimation. Springer. [Amazon]