DATA SCIENCE LAB

Scheda dell'insegnamento

Anno accademico di regolamento: 
2018/2019
Anno di corso: 
1
Anno accademico di erogazione: 
2018/2019
Tipo di attività: 
Obbligatorio
Lingua: 
Italiano
Crediti: 
6
Ciclo: 
Secondo Semestre
Ore di attivita' didattica: 
50
Prerequisiti: 

Machine learning e statistical modelling

Moduli

Metodi di valutazione

Tipo di esame: 
Orale
Modalita' di verifica dell'apprendimento: 

Elaborazione di un lavoro di data science di gruppo e presentazione del medesimo.

Valutazione: 
Voto Finale

Obiettivi formativi

Obiettivo del corso è l'analisi e la manipolazione di dati usando tecniche di statistica e data mining.

Lo studente, al termine del corso, sarà in grado di capire, distinguere e proporre modelli complessi a seconda del tipo di problema e dato sotto esame.

Contenuti

Metodi per la ristrutturazione di dataset, per l'analisi preliminare dei dati e per la creazione di modelli statistici, di data mining e di machine learning applicati alla soluzione di problemi reali. Il software utilizzato sarà principalmente R.

Programma esteso

Basi di R
Gestione di dati in R e rappresentazioni grafiche usando R e il pacchetto ggplot2
Programmare in R: cluster analisi come esempio di funzione R
Modelli lineari generalizzati con Lasso e Ridge
Dati mancanti e il loro trattamento
Analisi preliminari, complessità e metriche
Alberi decisionali e k-nearest neighbor
Foreste casuali e bagging
Support Vector Machines
Associazione e raccomandazione
Ida, reti neurali
Naive Bayes, Tree Augmente Naive Bayes
Dati longitudinali e processi di Markov latenti
Casi di studio
Inizio dei progetti di gruppo

Bibliografia consigliata

Useremo estratti dai seguenti volumi (scaricabili gratuitamente per gli studenti Bicocca)

Su R

Hadley Wickham (2014) Advanced R. CRC Press URL

Sullo Statistical Learning

Trevor Hastie, Robert Tibshirani, Jerome Friedman (2009) The Elements of Statistical Learning. Springer URL

Uso di R in Data Science

Benjamin S. Baumer, Daniel T. Kaplan, Nicholas J. Horton (2017) Modern Data Science with R. Chapman and Hall/CRC URL

Garrett Grolemund, Hadley Wickham (2017) R for Data Science. O’Reilly URL

Metodi didattici

Lezioni in laboratorio con le mani sui dati