3.3 Medie mobili

Il metodo classico di decomposizione delle serie storiche ha avuto origine nel 1920 circa ed è stato ampiamente utilizzato fino agli anni ’50. Questo metodo costituisce ancora la base di molti metodi di decomposizione, e per questo motivo è importante capirne il funzionamento. Il primo passaggio in una decomposizione classica consiste nell’usare il metodo delle medie mobili per stimare il trend-ciclo, che è il primo argomento che viene descritto di seguito.

Lisciamento tramite medie mobili

Una media mobile di ordine \(m\) può essere scritta come \[\begin{equation} \hat{T}_{t} = \frac{1}{m} \sum_{j=-k}^k y_{t+j}, \tag{3.2} \end{equation}\] dove \(m=2k+1\). Con questa procedura si ottiene una stima della componente trend-ciclo al tempo \(t\) effettuando la media dei valori della serie storica compresi in una finestra temporale di ampiezza \(k\) periodi rispetto al tempo \(t\). Le osservazioni contigue nel tempo hanno una certa probabilità di avere valori simili, quindi la media elimina una parte della casualità presente nei dati e produce una componente di trend-ciclo più regolare. La serie lisciata ottenuta viene detta media mobile \(m\)-MA, ossia una media mobile di ordine \(m\).

Si consideri a titolo di esempio la figura 3.9, che mostra le esportazioni annuali di beni e servizi australiani in percentuale rispetto al PIL, dal 1960 al 2017. Questi dati sono mostrati anche nella tabella 3.1.

global_economy %>%
  filter(Country == "Australia") %>%
  autoplot(Exports) +
  labs(x = "Anno", y = "% del PIL", title = "Esportazioni totali australiane")
Esportazioni di beni e servizi australiani: 1960--2017.

Figura 3.9: Esportazioni di beni e servizi australiani: 1960–2017.

Tabella 3.1: Esportazione annuale di beni e servizi australiani: 1960–2017.
Anno Esportazioni 5-MA
1960 12.99
1961 12.40
1962 13.94 13.46
1963 13.01 13.50
1964 14.94 13.61
1965 13.22 13.40
1966 12.93 13.25
1967 12.88 12.66
2010 19.84 21.21
2011 21.47 21.17
2012 21.52 20.78
2013 19.99 20.81
2014 21.08 20.37
2015 20.01 20.32
2016 19.25
2017 21.27

Nell’ultima colonna della tabella viene mostrata una media mobile di ordine 5, che fornisce una stima del trend-ciclo. Il primo valore della colonna corrisponde alla media delle prime cinque osservazioni, calcolata nei periodi 1960–1964; il secondo valore nella colonna 5-MA è la media dei valori del 1961–1965; e così via. Ogni valore nella colonna 5-MA è pari alla media delle osservazioni nella finestra temporale di cinque anni centrata sull’anno corrispondente. In base alla notazione dell’equazione (3.2), la colonna 5-MA contiene i valori di \(\hat{T}_{t}\) con \(k=2\) e \(m=2k+1=5\). Partendo dalla stessa formula si evince che non è possibile calcolare la media mobile né per i primi due anni né per gli ultimi due anni, in quanto mancano due osservazioni su entrambi i lati. Nei prossimi paragrafi saranno introdotti metodi più sofisticati che permetteranno di ottenere stime anche in corrispondenza delle osservazioni agli estremi della serie.

Le medie mobili sono facilmente calcolabili con il comando slide_dbl() disponibile nel package slider, che agisce sulla serie applicando, iterativamente, una funzione alle finestre temporali “scorrevoli”. In questo caso, si utilizza la funzione mean() ed una finestra di dimensione 5.

aus_exports <- global_economy %>%
  filter(Country == "Australia") %>%
  mutate(
    `5-MA` = slider::slide_dbl(Exports, mean,
                .before = 2, .after = 2, .complete = TRUE)
  )

In figura 3.10 la serie originaria è tracciata insieme alla componente trend-ciclo stimata mediante le medie mobili.

aus_exports %>%
  autoplot(Exports) +
  geom_line(aes(y = `5-MA`), colour = "#D55E00") +
  labs(x = "Anno", y = "% del GDP",
       title = "Esportazioni totali australiane") +
  guides(colour = guide_legend(title = "series"))
Esportazioni australiane (linea nera) e stima 5-MA della componente trend-ciclo (linea arancione).

Figura 3.10: Esportazioni australiane (linea nera) e stima 5-MA della componente trend-ciclo (linea arancione).

La componente trend-ciclo (in arancione) è più “liscia” rispetto ai dati originari e riesce a catturare la tendenza principale della serie storica trascurando le fluttuazioni minori. L’ordine della media mobile determina il grado di lisciatura del trend-ciclo stimato. In generale, un ordine più grande produce una curva più liscia. La figura 3.11 mostra l’effetto del cambiamento dell’ordine della media mobile per i dati delle esportazioni australiane.

Medie mobili di ordine differente applicate ai dati sulle esportazioni australiane.

Figura 3.11: Medie mobili di ordine differente applicate ai dati sulle esportazioni australiane.

Le medie mobili semplici come quelle appena introdotte sono solitamente di ordine dispari (ad esempio 3, 5, 7, ecc.). Questo perché sono simmetriche: in una media mobile di ordine \(m=2k+1\) si effettua la media tra l’osservazione centrale e le \(k\) osservazioni più vicine su entrambi i lati. Se \(m\) fosse pari, la media mobile non sarebbe più simmetrica.

Medie mobili di medie mobili

Un’alternativa alle medie mobili semplici è data dall’applicazione delle medie mobili su una media mobile. Il motivo per cui si ricorre a questa procedura è quello di rendere simmetrica una media mobile di ordine pari.

Per esempio, si consideri una media mobile di ordine 4 e si applichi un’altra media mobile di ordine 2 ai risultati ottenuti. Nella tabella seguente si mostrano gli effetti della media mobile applicata due volte ai dati trimestrali australiani sulla produzione di birra.

beer <- aus_production %>%
  filter(year(Quarter) >= 1992) %>%
  select(Quarter, Beer)
beer_ma <- beer %>%
  mutate(
    `4-MA` = slider::slide_dbl(Beer, mean,
                .before = 1, .after = 2, .complete = TRUE),
    `2x4-MA` = slider::slide_dbl(`4-MA`, mean,
                .before = 1, .after = 0, .complete = TRUE)
  )
Tabella 3.2: Media mobile di ordine 4 applicata ai dati trimestrali sulla birra, seguita da una media mobile di ordine 2.
Trimestre Birra 4-MA 2x4-MA
1992 Q1 443.00
1992 Q2 410.00 451.25
1992 Q3 420.00 448.75 450.00
1992 Q4 532.00 451.50 450.12
1993 Q1 433.00 449.00 450.25
1993 Q2 421.00 444.00 446.50
2009 Q1 415.00 430.00 428.88
2009 Q2 398.00 430.00 430.00
2009 Q3 419.00 429.75 429.88
2009 Q4 488.00 423.75 426.75
2010 Q1 414.00
2010 Q2 374.00

La notazione “\(2\times4\)-MA” nell’ultima colonna rappresenta una media mobile 4-MA seguita da una media mobile 2-MA. I valori dell’ultima colonna sono ottenuti calcolando una media mobile di ordine 2 sui valori della colonna precedente. Ad esempio, i primi due valori della colonna 4-MA sono 451.25=(443+410+420+532)/4 e 448.75=(410+420+532+433)/4. Il primo valore nella colonna 2x4-MA è pari alla media di questi due: 450.00=(451.25+448.75)/2.

Quando una media mobile 2-MA segue una media mobile di ordine pari (come ad esempio 4-MA) viene chiamata “media mobile centrata di ordine 4”, in quanto i risultati sono ora simmetrici. In formule, si ottiene che è possibile scrivere la \(2\times4\)-MA come segue: \[\begin{align*} \hat{T}_{t} &= \frac{1}{2}\Big[ \frac{1}{4} (y_{t-2}+y_{t-1}+y_{t}+y_{t+1}) + \frac{1}{4} (y_{t-1}+y_{t}+y_{t+1}+y_{t+2})\Big] \\ &= \frac{1}{8}y_{t-2}+\frac14y_{t-1} + \frac14y_{t}+\frac14y_{t+1}+\frac18y_{t+2}. \end{align*}\] La serie risultante è una media ponderata di osservazioni, che è anche simmetrica.

Si osservi infine che è possibile utilizzare anche altre combinazioni di medie mobili. Per esempio, si usa spesso una media mobile \(3\times3\)-MA, che consiste in una media mobile di ordine 3 seguita da un’altra media mobile di ordine 3. In generale, una media mobile di ordine pari dovrebbe essere seguita da una MA di ordine pari per assicurarne la simmetria. Allo stesso modo, un media mobile di ordine dispari dovrebbe essere seguita da una MA di ordine dispari.

Stima del trend-ciclo con dati stagionali

Le medie mobili centrate sono comunemente utilizzate per stimare la componente trend-ciclo dai dati stagionali. Si consideri la media mobile \(2\times4\)-MA \[ \hat{T}_{t} = \frac{1}{8}y_{t-2} + \frac{1}{4}y_{t-1} + \frac{1}{4}y_{t} + \frac{1}{4}y_{t+1} + \frac{1}{8}y_{t+2}. \] Quando questo tipo di media mobile viene applicata ai dati trimestrali si ottiene che ad ogni trimestre dell’anno viene dato lo stesso peso, poiché i valori iniziali e finali della finestra si applicano allo stesso trimestre negli anni consecutivi. Di conseguenza, la variazione stagionale sarà mediata ed i valori risultanti di \(\hat{T}_t\) avranno una componente stagionale bassa o nulla. Un effetto simile si otterrebbe, sempre con dati trimestrali, se si utilizzasse una \(2\times 8\)-MA oppure una \(2\times 12\)-MA.

In generale, una media mobile \(2\times m\)-MA è equivalente ad una media mobile ponderata di ordine \(m+1\), dove tutte le osservazioni hanno un peso \(1/m\), tranne il primo e l’ultimo termine che hanno un peso pari a \(1/(2m)\). Quindi, se il periodo stagionale è pari e di ordine \(m\), in genere si utilizza una media mobile \(2\times m\)-MA per stimare il trend-ciclo. Se il periodo stagionale è invece dispari e di ordine \(m\), il trend-ciclo si ottiene applicando una \(m\)-MA. Per esempio, una \(2\times 12\)-MA può essere usata per stimare la componente trend-ciclo di dati mensili con stagionalità annuale, mentre una 7-MA può essere usata nel caso di dati giornalieri con stagionalità settimanale.

Altre scelte per l’ordine della media mobile generano di solito stime della componente trend-ciclo che sono influenzate dalla stagionalità dei dati.

Esempio: Occupati nel settore della vendita al dettaglio negli Stati Uniti

us_retail_employment_ma <- us_retail_employment %>%
  mutate(
    `12-MA` = slider::slide_dbl(Employed, mean,
                .before = 5, .after = 6, .complete = TRUE),
    `2x12-MA` = slider::slide_dbl(`12-MA`, mean,
                .before = 1, .after = 0, .complete = TRUE)
  )
us_retail_employment_ma %>%
  autoplot(Employed, colour = "gray") +
  geom_line(aes(y = `2x12-MA`), colour = "#D55E00") +
  labs(y = "Persone (migliaia)",
       title = "Occupazione totale nella vendita al dettaglio negli Stati Uniti")
Occupati nel settore della vendita al dettaglio negli Stati Uniti, valori originari e 2x12-MA.

Figura 3.12: Occupati nel settore della vendita al dettaglio negli Stati Uniti, valori originari e 2x12-MA.

La figura 3.12 mostra una \(2\times12\)-MA applicata al numero di impiegati nel settore della vendita al dettaglio negli Stati Uniti. Si noti che la serie ottenuta è liscia e non mostra alcuna stagionalità; il suo andamento è molto simile alla serie del trend-ciclo mostrata in figura 3.6, che è stata ottenuta mediante l’utilizzo di un metodo più sofisticato di una media mobile. Qualsiasi altra scelta per l’ordine della media mobile (eccetto 24, 36, ecc.) avrebbe dato come risultato una serie liscia contenente però alcune fluttuazioni stagionali.

Medie mobili ponderate

Le combinazioni di medie mobili danno luogo a medie mobili ponderate. Per esempio, la media mobile \(2\times4\)-MA discussa precedentemente è equivalente ad una media mobile ponderata 5-MA con pesi pari a \(\left[\frac{1}{8},\frac{1}{4},\frac{1}{4},\frac{1}{4},\frac{1}{8}\right]\). In generale, una \(m\)-MA ponderata può essere scritta come \[ \hat{T}_t = \sum_{j=-k}^k a_j y_{t+j}, \] dove \(k=(m-1)/2\) e i pesi sono dati da \(\left[a_{-k},\dots,a_k\right]\). È importante che i pesi abbiano somma unitaria (\(\sum_{j=-k}^{k} a_j = 1\)) e che siano simmetrici (\(a_j = a_{-j}\)). La media mobile semplice di ordine \(m\) è un caso speciale di media mobile ponderata in cui i pesi sono tutti pari a \(1/m\).

Uno dei principali vantaggi delle medie mobili ponderate è che permettono di produrre una stima più liscia della componente trend-ciclo. I pesi utilizzati sono in genere inversamente proporzionali alla distanza dei termini ad essi associati rispetto al valore centrale della finestra temporale. In questo modo i valori estremi hanno un impatto minore nel calcolo della media rispetto a quelli centrali, producendo come risultato una curva più liscia.