8.8 Esercizi

  1. Considera il numero di maiali macellati nello stato australiano di Victoria, disponibile nel dataset aus_livestock.

    1. Utilizza la funzione ETS() per stimare il modello equivalente al lisciamento esponenziale semplice. Trova i valori ottimali di \(\alpha\) e \(\ell_0\), e calcola le previsioni per i prossimi quattro mesi.
    2. Calcola un intervallo di previsione al 95% per la prima previsione usando \(\hat{y} \pm 1.96s\) dove \(s\) è la deviazione standard dei residui. Confronta l’intervallo trovato con quello prodotto da R.
  2. Scrivi una funzione per implementare il lisciamento esponenziale semplice. La funzione dovrebbe prendere gli argomenti y (la serie temporale), alpha (il parametro di smoothing \(\alpha\)) e level (il livello iniziale \(\ell_0\)). Inoltre, dovrebbe fornire la previsione della prossima osservazione della serie. Fornisce la stessa previsione di ETS()?

  3. Modifica la funzione che hai scritto nell’esercizio precedente in modo che fornisca la somma degli errori al quadrato anziché la previsione dell’osservazione successiva. Utilizza quindi la funzione optim() per trovare i valori ottimali di \(\alpha\) e \(\ell_0\). Ottieni gli stessi valori della funzione ETS()?

  4. Combina le due funzioni precedenti per produrre una funzione che trovi i valori ottimali di \(\alpha\) e \(\ell_0\) e che produca una previsione della prossima osservazione della serie.

  5. Il dataset global_economy contiene le esportazioni annuali di molti paesi. Seleziona un paese da analizzare.

    1. Rappresenta graficamente la serie delle esportazioni e discuti le caratteristiche principali dei dati.
    2. Usa un modello ETS(A,N,N) per prevedere la serie e rappresenta graficamente le previsioni.
    3. Calcola i valori dell’RMSE per i dati del training set.
    4. Confronta i risultati con quelli di un modello ETS(A,A,N). (Ricorda che il modello con il trend utilizza un parametro in più rispetto al modello più semplice). Discuti i vantaggi dei due metodi di previsione per questa serie di dati.
    5. Confronta le previsioni di entrambi i metodi. Quale pensi sia il migliore?
    6. Calcola un intervallo di previsione al 95% per la previsione un passo in avanti per ogni modello, utilizzando i valori dell’RMSE e assumendo errori normali. Confronta i tuoi intervalli con quelli prodotti utilizzando R.
  6. Prevedi il PIL cinese dal dataset global_economy usando un modello ETS. Sperimenta le varie opzioni della funzione ETS() per vedere quanto cambiano le previsioni con un trend smorzato, o con una trasformazione di Box-Cox. Cerca di spiegare in maniera intuitiva cosa comporta ciascuna di esse sulle previsioni.

    [Suggerimento: utilizza un valore relativamente grande di h quando calcoli le previsioni, in modo da poter vedere chiaramente le differenze tra le varie opzioni quando le previsioni vengono rappresentate graficamente].

  7. Trova un modello ETS per i dati del gas contenuti in aus_production ed ottieni una previsione per i prossimi anni. Perché qui è necessaria la stagionalità moltiplicativa? Prova ad utilizzare il trend smorzato. Migliora le previsioni?

  8. Fai nuovamente riferimento ai dati delle serie temporali della vendita al dettaglio (dall’Esercizio 8 nel paragrafo 2.10).

    1. Perché la stagionalità moltiplicativa è necessaria per questa serie?
    2. Applica il metodo moltiplicativo di Holt-Winters ai dati. Prova ad usare il trend smorzato.
    3. Confronta l’RMSE delle previsioni a un passo dei due metodi. Quale preferisci?
    4. Controlla che i residui del metodo migliore assomiglino ad un white noise.
    5. Ora stima il modello usando i dati fino alla fine del 2010, quindi trova l’RMSE del test set. Ottieni risultati migliori o peggiori rispetto all’approccio naive stagionale dell’esercizio 7 nel paragrafo 5.11?
  9. Per gli stessi dati di vendita al dettaglio, prova ad utilizzare una decomposizione STL applicata alla serie trasformata secondo Box-Cox, seguita da ETS sui dati destagionalizzati. Come sono i risultati rispetto alle tue migliori previsioni precedenti ottenute sul test set?

  10. Considera la serie relativa al totale dei viaggi nazionali di pernottamento in tutta l’Australia dal dataset turismo.

    1. Rappresenta graficamente i dati e descrive le caratteristiche principali della serie.
    2. Decomponi la serie usando STL ed ottieni i dati destagionalizzati.
    3. Prevedi i prossimi due anni della serie usando un metodo con trend smorzato additivo applicato ai dati destagionalizzati. (Questo può essere specificato usando decomposition_model()).
    4. Prevedi i prossimi due anni della serie usando un modello appropriato per il metodo di Holt lineare applicato ai dati destagionalizzati (come prima, ma senza trend smorzato).
    5. Ora usa ETS() per scegliere un modello stagionale per i dati.
    6. Confronta l’RMSE del modello ETS con l’RMSE dei modelli che hai ottenuto usando le decomposizioni STL. Quale modello fornisce i migliori risultati nel campione?
    7. Confronta le previsioni ottenute con i tre approcci utilizzati. Quale sembra più ragionevole?
    8. Controlla i residui del tuo modello preferito.
  11. Per questo esercizio usa la serie relativa al numero trimestrale di arrivi in Australia dalla Nuova Zelanda, per il periodo 1981 Q1 – 2012 Q3, contenuta nel dataset aus_arrivals.

    1. Costruisci un grafico temporale dei dati e descrivi le caratteristiche principali della serie.
    2. Crea un training set che escluda gli ultimi due anni di dati disponibili. Prevedi i valori del test set usando un modello appropriato per il metodo moltiplicativo di Holt-Winters.
    3. Perché in questo caso è necessario usare la stagionalità moltiplicativa?
    4. Prevedi le osservazioni del test set biennale usando ciascuno dei seguenti metodi:
      • un modello ETS;
      • un modello ETS additivo applicato a una serie trasformata;
      • un metodo naive stagionale;
      • una decomposizione STL applicata ai dati log trasformati seguita da un modello ETS applicato ai dati destagionalizzati (trasformati).
    5. Quale metodo fornisce le previsioni migliori? Supera i test dei residui?
    6. Confronta gli stessi quattro metodi usando la cross validation di serie temporali invece di usare un training set e un test set. Le conclusioni sono le stesse?
    1. Applica tecniche di cross validation per produrre previsioni ETS e naive stagionali aa 1 anno di distanza per la serie relativa alla produzione di cemento Portland (da aus_production). Utilizza una finestra temporale con dimensione iniziale di 5 anni, ed incrementa la finestra di un’osservazione alla volta.
    2. Calcola l’MSE dei risultanti errori \(4\) passi avanti. Quali previsioni sono più accurate? È quello che ti aspettavi?
  12. Confronta ETS(), SNAIVE() e decomposition_model(STL, ???) sulle seguenti cinque serie temporali. Potrebbe essere necessario utilizzare una trasformazione di Box-Cox per ottenere le previsioni col metodo di decomposizione STL. Utilizza un test set di tre anni per decidere quale metodo fornisce le migliori previsioni.

    • Produzione di birra e mattoni da aus_production.
    • Costo dei sussidi ai farmaci per il diabete (ATC2 == "A10") e i corticosteroidi (ATC2 == "H02") da PBS.
    • Fatturato totale della vendita al dettaglio di cibo per l’Australia da aus_retail.
    1. Utilizza ETS() per selezionare un modello appropriato per le seguenti serie: numero totale di viaggi in Australia dal dataset tourism, prezzi di chiusura dei quattro titoli contenuti nel dataset gafa_stock, e serie delle linci contenuta in pelt. Il metodo porta sempre ad ottenere buone previsioni?

    2. Trova un esempio in cui non funziona bene. Riesci a capire perché?

  13. Mostra che le previsioni puntuali di un modello ETS(M,A,M) sono uguali a quelle ottenute con il metodo moltiplicativo di Holt-Winters.

  14. Mostra che la varianza di previsione per un modello ETS(A,N,N) è data da \[ \sigma^2\left[1+\alpha^2(h-1)\right]. \]

  15. Scrivi gli intervalli di previsione al 95% per un modello ETS(A,N,N) in funzione di \(\ell_T\), $ $, \(h\) e \(\sigma\), assumendo errori normalmente distribuiti.