Anno di corso: 1

Crediti: 6
Crediti: 9
Crediti: 9
Crediti: 6
Crediti: 6
Crediti: 3
Tipo: Lingua/Prova Finale
Crediti: 3
Tipo: Lingua/Prova Finale
Crediti: 3
Tipo: Lingua/Prova Finale
Crediti: 3
Tipo: Lingua/Prova Finale
Crediti: 3
Tipo: Altro

Anno di corso: 2

Anno di corso: 3

DATA MINING E STATISTICA COMPUTAZIONALE

Scheda dell'insegnamento

Anno accademico di regolamento: 
2014/2015
Anno di corso: 
3
Anno accademico di erogazione: 
2016/2017
Tipo di attività: 
Obbligatorio
Crediti: 
15
Ciclo: 
Primo Semestre
Ore di attivita' didattica: 
105
Prerequisiti: 

Nessuna propedeuticità formale. E’ però richiesta la conoscenza degli argomenti trattati nei corsi di Analisi Statistica Multivariata, Statistica computazionale e Statistica II

Moduli

Metodi di valutazione

Modalita' di verifica dell'apprendimento: 

Esame orale

Valutazione: 
Voto Finale

Obiettivi formativi

1) STAT computazionale
Richiami linguaggio SAS, SAS macro Interpretazione e costruzione di Modelli lineari (Anova, Ancova, GLM) e logistici complessi
Modelli robusti (Bootstrap, Jacknife, Regressione robusta) e regressione non parametrica

2. Data Mining, robustezza, overfitting e problematiche di validazione e classificazione
Modelli statistici per la classificazione supervisionata ed Algoritmi.

Contenuti

1.STAT computazionale
Costruzione di modelli robusti: misure di influenza, diagnostiche, model selection, trasformazioni, splines Additive Models

2. Data Mining
Modelli statistici per la classificazione supervisionata ( analisi discriminante , logistico politomico e ordinale)
Algoritmi: (Naive Bayes, Nearest Neighbour, Alberi decisionali e Classificativi), metodi ensamble (bagging e random forest), reti neurali (cenni)

Programma esteso

Statistica computazionale

L'obiettivo principale del corso è introdurre strumenti software avanzati e di alta complessità computazionale per disegnare ed eseguire analisi di dati e modellazione statistica complessa.

Data mining
Il corso intende fornire un’introduzione alle principali tecniche statistiche di
Data Mining attraverso le
più moderne tecniche e
strategie per l’analisi di
grandi moli di dati,
illustrando le
problematiche connesse.

Introduzione alla Business
Intelligence , Modelli ed
algoritmi di Data mining,
Casi reali di Data Mining

Bibliografia consigliata

G. James, D. Witten, T. Hastie and R. Tibshirani

An Introduction to statistical learning http://www-bcf.usc.edu/~gareth/ISL

STAT COMPUTAZIONALE
Cap 3 (3.1-3.4)
Cap 4 (fino 4.3 compreso)
Cap 6
Cap 7 (7.1-7.7)

DATA MINING
Cap 1-2-4-5- 6-8

Metodi didattici

Lezioni in laboratorio