10.7 Esercizi

  1. Questo esercizio utilizza il dataset LakeHuron che fornisce il livello del Lago Huron dal 1875-1972.

    1. Converti i dati in un oggetto tsibble usando la funzione as_tsibble().
    2. Stima un trend lineare a tratti sui dati del Lago Huron impostando uno nodo in corrispondenza dell’anno 1920 ed una stuttura di errore di tipo ARMA.
    3. Prevedi il livello per i prossimi 30 anni. Ritieni che il trend lineare estrapolato sia realistico?
  2. Ripeti l’esercizio 4 del paragrafo 7.10, aggiungendo gli errori ARIMA per tener conto dell’autocorrelazione nei residui.

    1. Che differenza produce il processo di errore ARIMA nei coefficienti di regressione?
    2. Che differenza produce il processo di errore ARIMA nelle previsioni?
    3. Controlla i residui del modello stimato per assicurarti che il processo ARIMA tenga adeguatamente conto dell’autocorrelazione osservata nel modello TSLM.
  3. Ripeti l’esempio dell’energia elettrica giornaliera, ma invece di usare una funzione quadratica della temperatura, utilizza una funzione lineare discontinua con un “nodo” intorno ai 25 gradi Celsius (usa i predittori Temperatura & Temp2). Come puoi ottimizzare la scelta del nodo?

    I dati possono essere generati come mostrato di seguito.

    vic_elec_daily <- vic_elec %>%
      filter(year(Time) == 2014) %>%
      index_by(Date = date(Time)) %>%
      summarise(
        Demand = sum(Demand)/1e3,
        Temperature = max(Temperature),
        Holiday = any(Holiday)) %>%
      mutate(
        Temp2 = I(pmax(Temperature-20,0)),
        Day_Type = case_when(
          Holiday ~ "Holiday",
          wday(Date) %in% 2:6 ~ "Weekday",
          TRUE ~ "Weekend"))
  4. Questo esercizio considera aus_accommodation: il totale degli incassi trimestrali degli alloggi e il livello di occupazione delle camere per hotel, motel e guest house in Australia, tra gennaio 1998 e giugno 2016. Il totale degli incassi trimestrali è espresso in milioni di dollari australiani.

    1. Calcola gli incassi corretti per l’IPC e rappresenta graficamente il risultato per ogni stato
    2. Per ogni stato, adatta un modello di regressione dinamico degli incassi corretti per l’IPC con variabili dummy stagionali, un trend temporale lineare con un nodo al 1° trimestre 2008 ed errori ARIMA.
    3. Verifica che i residui del modello corrispondano a quelli generati da un rumore bianco.
    4. Prevedi gli incassi per ogni stato fino alla fine del 2017. (Suggerimento: è necessario produrre prima le previsioni dell’IPC).
    5. Quali fonti di incertezza non sono state prese in considerazione negli intervalli di previsione?
  5. Nell’Esercizio 5 del paragrafo 7.10 è stato stimato un modello di regressione armonica ad una parte della serie us_gasoline . Si rivisiterà ora questo modello estendendolo al fine di includere più dati ed errori ARMA.

    1. Utilizzando TSLM(), adatta una regressione armonica con un trend temporale costante a tratti alla serie completa. Seleziona la posizione dei nodi nel trend ed il numero appropriato di termini di Fourier da includere minimizzando il valore dell’indice AICc o CV.
    2. Stima ora il modello usando ARIMA() per consentire errori correlati, mantenendo le stesse variabili predittive usate con TSLM().
    3. Controlla i residui del modello finale usando la funzione gg_tsresiduals() e il test di Ljung-Box. I residui sembrano essere sufficientemente simili al rumore bianco procedere? In caso contrario, prova a modificare il modello o a rimuovere i primi anni di osservazioni.
    4. Dopo aver ottenuto un modello con residui di tipo rumore bianco, produci le previsioni per l’anno successivo.
  6. Il consumo di energia elettrica è spesso modellato in funzione della temperatura. La temperatura è misurata dai gradi di riscaldamento e raffreddamento giornalieri. I gradi di riscaldamento corrispondono a \(18^\circ\)C meno la temperatura media giornaliera quando la media giornaliera è inferiore ai \(18^\circ\)C; altrimenti è zero. Questo fornisce una misura del bisogno di riscaldarsi quando la temperatura scende. I gradi di raffreddamento misurano il bisogno di raffreddarsi quando la temperatura sale. È definito come la temperatura media giornaliera meno \(18^\circ\)C quando la media giornaliera è superiore a \(18^\circ\)C; altrimenti è zero. Sia \(y_t\) il totale mensile dei kilowatt per ora di energia elettrica utilizzata, sia \(x_{1,t}\) il totale mensile dei gradi di riscaldamento, e sia \(x_{2,t}\) il totale mensile dei gradi di raffreddamento.

    Un analista ha adattato il seguente modello ad un insieme di questi dati: \[y^*_t = \beta_1x^*_{1,t} + \beta_2x^*_{2,t} + \eta_t,\] dove \[(1-\Phi_{1}B^{12} - \Phi_{2}B^{24})(1-B)(1-B^{12})\eta_t = (1+\theta_1 B)\varepsilon_t\] e \(y^*_t = \log(y_t)\), \(x^*_{1,t} = \sqrt{x_{1,t}}\) e \(x^*_{2,t}=\sqrt{x_{2,t}}\).

    1. Che tipo di modello ARIMA viene identificato per \(\eta_t\)?

    2. I coefficienti stimati sono

    Parametro Stima s.e. \(Z\) \(P\)-value
    \(\beta_1\) 0.0077 0.0015 4.98 0.000
    \(\beta_2\) 0.0208 0.0023 9.23 0.000
    \(\theta_1\) -0.5830 0.0720 8.10 0.000
    \(\Phi_{1}\) -0.5373 0.0856 -6.27 0.000
    \(\Phi_{2}\) -0.4667 0.0862 -5.41 0.000

    Spiega quali informazioni forniscono sul consumo di energia elettrica le stime di \(\beta_1\) e \(\beta_2\) .

    1. Scrivi l’equazione in una forma più adatta alla previsione.
    2. Descrivi come questo modello potrebbe essere usato per prevedere la domanda di energia elettrica per i prossimi 12 mesi.
    3. Spiega perché il termine \(\eta_t\) dovrebbe essere modellato con un modello ARIMA piuttosto che modellare i dati usando un package per regressione standard. Nella discussione, commenta le proprietà delle stime, la validità dei risultati della regressione standard e l’importanza del modello \(\eta_t\) nella produzione di previsioni.
  7. Per le serie temporali al dettaglio considerate nei capitoli precedenti:

    1. Sviluppa un modello di regressione dinamica appropriato con termini di Fourier per la stagionalità. Utilizza l’indice AICc per selezionare il numero di termini di Fourier da includere nel modello. (Probabilmente sarà necessario utilizzare la stessa trasformazione Box-Cox identificata in precedenza).
    2. Controlla i residui del modello stimato. La serie dei residui assomiglia a quella generata da un processo rumore bianco?
    3. Confronta le previsioni con quelle ottenute in precedenza utilizzando modelli alternativi.