Anno di corso: 1

Crediti: 6
Crediti: 9
Crediti: 9
Crediti: 6
Crediti: 6
Crediti: 3
Tipo: Lingua/Prova Finale
Crediti: 3
Tipo: Lingua/Prova Finale
Crediti: 3
Tipo: Lingua/Prova Finale
Crediti: 3
Tipo: Lingua/Prova Finale
Crediti: 3
Tipo: Altro

Anno di corso: 2

Anno di corso: 3

ANALISI STATISTICA MULTIVARIATA

Scheda dell'insegnamento

Anno accademico di regolamento: 
2016/2017
Anno di corso: 
2
Anno accademico di erogazione: 
2017/2018
Tipo di attività: 
Obbligatorio
Lingua: 
Italiano
Crediti: 
15
Ciclo: 
Annualita' Singola
Ore di attivita' didattica: 
106
Prerequisiti: 

Parte I:
Ambiente R, RStudio e SAS

Parte II:
Algebra lineare, Analisi Matematica I, Calcolo delle probabilità, Statistica I

Moduli

Metodi di valutazione

Tipo di esame: 
Orale
Modalita' di verifica dell'apprendimento: 

Parte I:
Esame scritto, orale e laboratorio

Parte II:
Esame scritto e orale

Valutazione: 
Voto Finale

Obiettivi formativi

Parte I:
Il corso si propone di fornire le conoscenze sulla modellistica per utilizzare i dati aventi natura multivariata attraverso analisi grafiche, statistiche e modelli statistici computazionali per dati di natura sia continua che categoriale.
Il corso presenta un taglio sia teorico che applicativo basato sull’analisi e sulla discussione dei risultati delle tecniche esposte applicate a dati
provenienti da varie fonti informative.

Parte II:
Il modulo di Analisi Esplorativa introduce i principali metodi statistici descrittivi per lo studio di due o più fenomeni osservabili congiuntamente su un insieme di unità statistiche. Si tratta di metodi finalizzati all’esplorazione dei dati multivariati per individuarne la struttura soggiacente e ridurne la dimensionalità in modo da preservare le caratteristiche principali osservate. Dal punto di vista applicativo l’analisi dei dati viene affrontata con il ricorso ai due software R e SAS.

Contenuti

Parte I:
Il corso presenta i modelli statistici utili per l’analisi e la riduzione delle informazioni presenti quando si dispone di varie misure sulla stessa unità. Lo studente viene introdotto ad analisi grafiche dei dati ed ai concetti base dell’inferenza Bayesiana attraverso esempi applicativi su dati reali. Vengono introdotti i modelli di regressione lineare multivariata ed il modello di regressione logistica multipla ed altre tecniche di regressione non parametrica.

Parte II:
Introduzione all’analisi statistica multivariata, matrici di dati quantitativi, qualitativi e misti, rappresentazioni grafiche per dati multidimensionali. Cluster Analysis: metodi di raggruppamento gerarchici e non gerarchici. Analisi delle componenti principali. Analisi fattoriale esplorativa. Uso integrato dei metodi esplorativi di analisi multivariata. Applicazioni a dati reali con i software R e SAS

Programma esteso

Parte I:
Vengono trattate delle tecniche avanzate di inferenza statistica utilizzando le distribuzioni multivariate tra cui la normale multivariata. Lo studente viene introdotto ai concetti base dell’inferenza Bayesiana attraverso esempi applicativi.
Il modello di regressione lineare multivariato ed il modello di regressione logistica multipla vengono introdotti ed approfonditi considerando gli aspetti di stima, inferenza, diagnosi e previsione. In particolare si considera la regressione logistica nell’ambito dei modelli lineari generalizzati. Sono fornite delle nozioni di base circa i modelli grafici di Gauss. Vengono forniti dei cenni anche alle tecniche di regressione multivariata non parametrica.
Gli argomenti trattati a livello teorico vengono illustrati con applicazioni a dati reali sviluppati tramite l’ambiente statistico R, Rstudio ed il software SAS.

Parte II:
- Introduzione all’analisi statistica multivariata: scuola francese e scuola anglosassone, classificazione delle metodologie di analisi multivariata
- Matrici di dati quantitativi, qualitativi e misti. Principali sintesi e trasformazioni. Rappresentazione dei dati, spazio degli individui e spazio delle variabili. Dissimilarità e distanze fra unità, distanze fra variabili
- Cluster Analysis: metodi di raggruppamento gerarchici e non gerarchici, bontà della classificazione, applicazione a variabili quantitative e qualitative
- Analisi delle componenti principali: estrazione delle componenti principali, criteri di arresto, valutazione della variabilità riprodotta, interpretazione delle componenti principali, applicazioni
- Analisi fattoriale esplorativa: modello fattoriale, studio delle correlazioni, metodi di estrazione dei fattori, rotazione dei fattori, punteggi fattoriali, applicazioni
- Uso integrato delle tecniche esplorative di analisi multivariata

Bibliografia consigliata

Parte I:
Materiale didattico (dispense, diapositive, programmi di calcolo, etc..) disponibile sulla pagina della piattaforma e-learning dell’ateneo dedicata al corso.

Faraway J. J. (2014). Linear models in R, Second Edition, Chapman & Hall, CRC Press.

Faraway, J. J. (2016). Extending the linear model with R: generalized linear, mixed effects and nonparametric regression models. 2nd Edition Chapman & Hall, , CRC Press.

Højsgaard, S., Edwards, D., & Lauritzen, S. (2012). Graphical models with R. Springer Science & Business Media.

James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An introduction to statistical learning, New York, Springer.

Nolan, D., & Lang, D. T. (2015). Data Science in R: A Case Studies Approach to Computational Reasoning and Problem Solving. Chapman & Hall, CRC Press.

SAS/STAT 12.1. User’s guide, SAS Institute, 2012.

Parte II:
- Frosini, B.V. (2014). Complementi di analisi statistica multivariata, EDUCatt, Milano
- Zani, S., Cerioli, A. (2007). Analisi dei dati e data mining per le decisioni aziendali, Giuffrè Editore, Milano
- Bolasco, S. (1999). Analisi multidimensionale dei dati: strategie e criteri di interpretazione, Carocci, Roma
- Dillon, W.R., Goldstein, M. (1984). Multivariate Analysis, J. Wiley, New York
- Everitt, B.S., Hothorn, T. (2011). An Introduction to Applied Multivariate Analysis with R, Springer, Berlin
- Khattree, R., Dayanand, N.N. (2000). Multivariate Data Reduction and Discrimination with SAS software, SAS Institute Inc., Cary, NC, USA

Metodi didattici

Parte I:
Lezioni frontali, esercitazioni ed applicazioni su dati reali e simulati con R, RStudio e SAS presso il laboratorio informatico.

Parte II:
Lezioni/Laboratorio