4.2 La funzione di autocorrelazione

L’autocorrelazione di ordine \(k\) è stata introdotta nel paragrafo 2.8. Tutti i valori ottenuti tramite la funzione di autocorrelazione (ACF) di una serie storica possono essere considerati come caratteristiche di una serie storica. Inoltre, combinando i risultati dell’ACF è possibile ottenere delle nuove caratteristiche; ad esempio, la somma del quadrato dei primi dieci coefficienti dell’ACF costituisce un indice di sintesi della quantità “generale” di autocorrelazione presente in una serie.

La funzione di autocorrelazione può essere utilizzata per confrontare cambiamenti tra periodi temporali differenti. In tal caso si effettua l’analisi sulle “serie differenziate una volta” creando, a partire dai dati iniziali (detti anche “serie nei livelli”), una sequenza di differenze tra osservazioni consecutive. Applicando nuovamente il passaggio alle differenze si ottiene una nuova serie “nelle differenze seconde”, e così via se si applica ripetutamente tale procedura. A partire da questi risultati, è possibile calcolare nuovamente l’ACF delle serie delle differenze al fine di ottenere informazioni utili riguardanti le caratteristiche della serie iniziale.

Lo studio delle differenze stagionali è un approccio che risulta utile in molti contesti, soprattutto economici. Si supponga di avere a disposizione dati mensili: in tal caso l’interesse potrebbe essere rivolto ad analizzare le differenze che intercorrono nello stesso mese di due anni consecutivi, ad esempio Gennaio, Febbraio, Marzo e così via. Analizzando tali differenze si ottiene quindi una sintesi dei cambiamenti annuali piuttosto che mensili. Anche in questo caso lo studio dell’ACF delle differenze stagionali risulta essere particolarmente informativo.

I vantaggi legati all’analisi delle serie differenziate saranno discussi in maniera più dettagliata nel paragrafo 9.1.

La funzione feat_acf() calcola alcune delle autocorrelazioni introdotte in questo paragrafo. In particolare, i valori che la funzione restituisce sono:

  • acf1, il coefficiente di autocorrelazione di ordine uno della serie originaria;
  • acf10, la somma dei quadrati delle prime dieci autocorrelazioni della serie originaria;
  • diff1_acf1, il coefficiente di autocorrelazione di ordine uno della serie nelle differenze prime;
  • diff1_acf10, la somma dei quadrati delle prime dieci autocorrelazioni della serie nelle differenze prime;
  • diff2_acf1, il coefficiente di autocorrelazione di ordine uno della serie nelle differenze seconde;
  • diff2_acf10, la somma dei quadrati delle prime dieci autocorrelazioni della serie nelle differenze seconde;
  • season_acf1, nel caso di dati stagionali, viene calcolato anche il coefficiente di autocorrelazione di ordine uno delle serie nelle differenze stagionali di ordine uno.

Nel caso dei dati australiani sul turismo si ottiene il seguente risultato:

tourism %>% features(Trips, feat_acf)
#> # A tibble: 304 × 10
#>    Region       State Purpose     acf1 acf10 diff1_acf1 diff1_acf10 diff2_acf1
#>    <chr>        <chr> <chr>      <dbl> <dbl>      <dbl>       <dbl>      <dbl>
#>  1 Adelaide     Sout… Busine…  0.0333  0.131     -0.520       0.463     -0.676
#>  2 Adelaide     Sout… Holiday  0.0456  0.372     -0.343       0.614     -0.487
#>  3 Adelaide     Sout… Other    0.517   1.15      -0.409       0.383     -0.675
#>  4 Adelaide     Sout… Visiti…  0.0684  0.294     -0.394       0.452     -0.518
#>  5 Adelaide Hi… Sout… Busine…  0.0709  0.134     -0.580       0.415     -0.750
#>  6 Adelaide Hi… Sout… Holiday  0.131   0.313     -0.536       0.500     -0.716
#>  7 Adelaide Hi… Sout… Other    0.261   0.330     -0.253       0.317     -0.457
#>  8 Adelaide Hi… Sout… Visiti…  0.139   0.117     -0.472       0.239     -0.626
#>  9 Alice Sprin… Nort… Busine…  0.217   0.367     -0.500       0.381     -0.658
#> 10 Alice Sprin… Nort… Holiday -0.00660 2.11      -0.153       2.11      -0.274
#> # ℹ 294 more rows
#> # ℹ 2 more variables: diff2_acf10 <dbl>, season_acf1 <dbl>