1.7 La prospettiva statistica della previsione

L’oggetto della previsione è incognito (altrimenti non ci sarebbe la necessità di prevederlo), per cui si può pensare ad esso come ad una variabile casuale. Ad esempio, le vendite totali per il prossimo mese potrebbero assumere una gamma di possibili valori, e finché non si conteggeranno le vendite effettive alla fine del mese non sarà possibile conoscerne il valore effettivo: fino a quando le vendite per il prossimo mese non saranno note, si tratterà di una quantità casuale.

Poiché il prossimo mese è relativamente vicino, si avrà un’idea ragionevole del valore che assumeranno le vendite. D’altro canto, se si fosse interessati a prevedere le vendite per lo stesso mese del prossimo anno, i valori possibili saranno molto più variabili. Nella maggior parte delle situazioni, la variabilità associata con l’obiettivo della previsione si ridurrà all’avvicinarsi dell’evento. In altre parole, più lontano è l’obiettivo della previsione, maggiore sarà l’incertezza.

È possibile immaginare differenti “futuri” (scenari), ad ognuno dei quali è associato un differente valore per l’oggetto che si desidera prevedere. In figura 1.2 il numero totale di arrivi internazionali in Australia, dal 1980 al 2015, è rappresentato utilizzando una linea nera. Sullo stesso grafico sono anche rappresentati dieci possibili scenari, per il periodo 2016–2025, utilizzando delle linee di differente colore.

Totale visitatori internazionali in Australia (1980-2015) con dieci possibili scenari futuri.

Figura 1.2: Totale visitatori internazionali in Australia (1980-2015) con dieci possibili scenari futuri.

Quando si ottiene una previsione è come si stesse stimando il centro dell’intervallo dei possibili valori che la variabile casuale può assumere. Spesso una previsione è accompagnata da un intervallo di previsione che fornisce un intervallo di valori che la variabile casuale potrebbe assumere con probabilità relativamente alta. Ad esempio, un intervallo di previsione contiene un intervallo di valori che dovrebbero contenere l’effettivo valore futuro con una probabilità del 95%.

Piuttosto che rappresentare graficamente i singoli possibili scenari futuri come mostrato in figura 1.2, si utilizzano invece gli intervalli di previsione. La figura 1.3 mostra gli intervalli all’80% ed al 95% per i futuri visitatori internazionali in Australia. La linea blu è la media dei possibili valori futuri, detta previsione puntuale.

(ref:figcapausta2) Totale visitatori internazionali in Australia (1980-2015) con dieci possibili scenari futuri ed intervalli di previsione all’80% ed al 95%.

(ref:figcapausta2)

Figura 1.3: (ref:figcapausta2)

L’indice \(t\) verrà utilizzato per far riferimento al tempo. Ad esempio \(y_t\) indicherà l’osservazione al tempo \(t\). Si supponga che \(\mathcal{I}\) indichi tutte le informazioni osservate e si supponga di essere interessati a prevedere \(y_t\). Si scriverà \(y_{t} | \mathcal{I}\) per indicare “la variabile casuale \(y_{t}\) dato quanto è noto in \(\mathcal{I}\)”. L’insieme di valori che questa variabile casuale potrebbe assumere, insieme con le corrispondenti probabilità, è noto come “distribuzione di probabilità” di \(y_{t} |\mathcal{I}\). Nel campo delle previsioni, si parla in particolare di distribuzione della previsione.

Quando si parla di “previsione”, si fa solitamente riferimento al valore medio della distribuzione della previsione, e si utilizza un “cappello” sulla \(y\) per questo scopo. Si scriverà perciò \(\hat{y}_t\) per la previsione di \(y_t\), vale a dire la media dei possibili valori che \(y_t\) potrebbe assumere a partire da tutto quello che è noto.

È spesso utile specificare esattamente quale informazione è stata utilizzata nel calcolare la previsione. Si scriverà ad esempio \(\hat{y}_{t|t-1}\) per indicare la previsione di \(y_t\) tenendo conto di tutte le precedenti osservazioni \((y_1,\dots,y_{t-1})\). Allo stesso modo, \(\hat{y}_{T+h|T}\) indica la previsione di \(y_{T+h}\) tenendo conto di \(y_1,\dots,y_T\) (una previsione cioè con passo \(h\) tenendo conto di tutte le osservazioni fino al tempo \(T\)).