STREAMING DATA MANAGEMENT AND TIME SERIES ANALYSIS

Scheda dell'insegnamento

Anno accademico di regolamento: 
2017/2018
Anno di corso: 
2
Anno accademico di erogazione: 
2018/2019
Tipo di attività: 
Obbligatorio a scelta
Lingua: 
Italiano
Crediti: 
6
Ciclo: 
Primo Semestre
Ore di attivita' didattica: 
46
Prerequisiti: 

Per seguire l'insegnamento con successo è necessario conoscere l'inferenza statistica e R.

Moduli

Metodi di valutazione

Modalita' di verifica dell'apprendimento: 

Esame scritto (su teoria) e analisi di serie storiche fornite dai docenti in laboratorio (nel medesimo giorno).

Valutazione: 
Voto Finale

Obiettivi formativi

Il corso fornisce gli strumenti per gestire, analizzare e prevedere dati in forma di serie storica anche quando generati in tempo reale.

Oltre alle metodologie per la gestione del dato in tempo reale, il corso copre sia modelli lineari (ARIMA, VAR, state-space/filtro di Kalman) sia modelli non lineari (reti neurali, support vector machine).

Lo studente che avrà seguito l'insegnamento con successo saprà gestire dati in tempo reale, scegliere e identificare il modello di serie storiche più adatto al problema e produrre scomposizioni e previsioni delle serie storiche sotto analisi.

Contenuti

Gestione dei dati in tempo reale, modelli basati su filtri lineari (ARIMA, VAR), modelli basati su componenti non osservabili (state-space/Kalman filter), modelli non lineari (reti neurali, support vector machine).

Programma esteso

First part (Pelagatti)

Theory of statistical prediction (best predictor, best linear predictors).
Stationary and integrated processes
ARIMA models
VAR models and cointegration
Unobserved Component Models (UCM)
State-space form
Kalman filter and maximum likelihood estimation of model in state-space form
State and disturbance smoothing
Many applications to real data using R and SAS

Second part (Candelieri)

Nature of time series data
Representing time series: raw data, features extraction, modelling
Historical versus streaming data
Managing time series data: time series databases
Main time series mining tasks
Similarity and Clustering
Classification, regression and forecasting
Non-parametric approaches based on machine Learning
Artificial Neural Networks
Support Vector Machines

Bibliografia consigliata

Pelagatti M. (2015) Time Series Modelling with Unobserved Component Models. Chapman and Hall/CRC (il libro è scaricabile gratuitamente sotto indirizzo IP di Bicocca).

Galit Shmueli, Kenneth C. Lichtendahl Jr. “Practical Time Series Forecasting with R: A Hands-On Guide” [2nd Edition] (Practical Analytics) – July 19, 2016

Ulteriore materiale sarà reso disponibile all'interno della piattaforma elearning.

Metodi didattici

Lezioni teoriche in aula e pratiche in laboratorio informatico. Sarebbe utile se gli studenti portassero con se un computer con istallato R anche durante le lezioni in aula.