4.4 Altre caratteristiche

Attraverso l’utilizzo del package feasts è possibile calcolare diversi indicatori di sintesi molto utili per effettuare l’analisi in serie storiche. Inoltre, risulta facile aggiungere degli indici personalizzati costruendo una funzione R ad-hoc che, a partire da una serie temporale univariata, restituisce un vettore numerico contenente i valori ricercati.

Per completezza, sono elencati di seguito i restanti indicatori presenti in feasts non discussi nei precedenti paragrafi. Alcuni di essi saranno analizzati e discussi in maggior dettaglio nei successivi capitoli.

  • coef_hurst calcola il coefficiente di Hurst di una serie storica; si tratta di un indicatore della presenza di persistenza o “memoria lunga” (long memory) della serie. Una serie dotata di memoria lunga presenta coefficienti di autocorrelazione alti per molti ordini.
  • feat_spectral stima l’indice di entropia spettrale (di Shannon) di una serie storica, utilizzato come misura della capacità di prevedere i valori futuri. Una serie con forti stagionalità e trend (quindi di facile previsione) avrà un’entropia vicina a zero. Al contrario, se la serie storica presenta una forte componente di “rumore” (per cui è difficile prevedere scenari futuri) restituisce un’entropia pari ad uno.
  • box_pierce restituisce la statistica del test white noise di Box-Pierce ed il suo corrispettivo p-value. Tale test è discusso in dettaglio nel paragrafo 5.4.
  • ljung_box produce la statistica del test white noise di Ljung-Box ed il suo corrispettivo p-value. Tale test è discusso in dettaglio nel paragrafo 5.4.
  • La funzione di autocorrelazione parziale (PACF) di \(k\)-esimo ordine misura la relazione che intercorre tra due serie composte dalle coppie di osservazioni distanti tra loro esattamente \(k\) periodi, dopo aver rimosso gli effetti relativi alle osservazioni che si trovano tra di essi. Per tale ragione, l’autocorrelazione parziale di primo ordine (PACF, con \(k=1\)) coincide con l’autocorrelazione di ordine primo (ACF, con \(k=1\)), dato che non ci sono osservazioni da rimuovere tra due valori consecutivi. La funzione di autocorrelazione parziale è discussa nel paragrafo 9.5. La funzione feat_pacf permette di calcolare la PACF per più ordini e contiene inoltre una serie di indicatori ad essa collegati, come ad esempio: la somma dei quadrati dei primi cinque ordini delle serie originarie, delle differenze prime e delle differenze seconde. Nel caso di dati stagionali, la funzione restituisce anche la PACF di ordine primo della serie destagionalizzata al primo ritardo.
  • unitroot_kpss fornisce la statistica del test di radice unitaria di Kwiatkowski-Phillips-Schmidt-Shin (KPSS), per verificare se una serie è stazionaria, ed il suo corrispondente p-value. Il test KPSS è introdotto nel paragrafo 9.1.
  • unitroot_pp fornisce la statistica del test di radice unitaria di Phillips-Perron, per verificare se una serie è stazionaria, ed il suo corrispondente p-value.
  • unitroot_ndiffs restituisce il numero minimo di differenze \(k\)-esime da generare al fine di ottenere una serie stazionaria in base al test KPSS. Questa procedura è discussa in dettaglio nel paragrafo 9.1
  • unitroot_nsdiffs restituisce il numero minimo di differenze stagionali \(k\)-esime necessarie per ottenere una serie stazionaria. Questa procedura è discussa in dettaglio nel paragrafo 9.1.
  • var_tiled_mean stima la varianza delle medie a blocchi (tiled means, la media di blocchi di osservazioni non sovrapposti). La lunghezza di default di un blocco è fissata pari a 10 se i dati non presentano stagionalità, oppure è pari alla lunghezza del periodo stagionale. A volte, questo indice è indicato come la “stabilità” della serie.
  • var_tiled_var stima la varianza delle varianze a blocchi (tiled variances, la varianza di blocchi di osservazioni non sovrapposte). Questo indice misura la “grumosità” della serie.
  • shift_level_max cerca il maggiore scostamento in media tra due finestre temporali consecutive. Si tratta di un indicatore utile per identificare salti (o cadute) repentini di una serie storica.
  • shift_level_index identifica l’istante temporale cui è associata la massima variazione in media.
  • shift_var_max cerca il maggiore scostamento in varianza tra due finestre temporali consecutive. Questo indice è utile per identificare cambiamenti repentini della volatilità di una serie storica.
  • shift_var_index restituisce l’istante temporale cui è associata la massima variazione in varianza.
  • shift_kl_max calcola la massima variazione in distribuzione, in base alla divergenza di Kulback-Leibler (KL), tra due finestre temporali consecutive. Tale indicatore è di aiuto per identificare cambiamenti repentini di una serie storica.
  • shift_kl_index restituisce l’istante temporale cui è associata la massima divergenza KL.
  • n_crossing_points calcola il numero di volte che una serie incrocia il livello definito dalla sua stessa mediana.
  • longest_flat_spot calcola il numero di blocchi di valori di una serie storica che presentano cambiamenti deboli o nulli.
  • stat_arch_lm stima la statistica basata sul test dei moltiplicatori di Lagrange (LM) di Engle (1982) per l’eteroschedasticità condizionale autoregressiva (ARCH).
  • guerrero calcola il parametro \(\lambda\) ottimale della trasformazione di Box-Cox tramite il metodo di Guerrero (discusso in dettaglio nel paragrafo 3.1).