MODELLI STATISTICI I

Scheda dell'insegnamento

Anno accademico di regolamento: 
2019/2020
Anno di corso: 
1
Anno accademico di erogazione: 
2019/2020
Tipo di attività: 
Obbligatorio
Lingua: 
Italiano
Crediti: 
12
Ciclo: 
Annualita' Singola
Ore di attivita' didattica: 
89
Prerequisiti: 

Per questa attività formativa è indispensabile la conoscenza degli
argomenti trattati nei corsi di base di Analisi Statistica Multivariata.

Moduli

Metodi di valutazione

Tipo di esame: 
Orale
Modalita' di verifica dell'apprendimento: 

L'esame consiste di una prova scritta ed un’analisi di casi empirici.

Valutazione: 
Voto Finale

Obiettivi formativi

Il corso ha quale obiettivo l’introduzione alla specificazione, stima e
verifica di modelli interpretativi dei dati di tipo lineare più avanzati del
modello lineare classico. Si presentano perciò modelli lineari generalizzati
sviluppati per i casi, rispettivamente, di: errori eteroschedastici e/o
correlati, più di una variabile dipendente, dati con struttura gerarchica e
variabili esplicative latenti. L'attività formativa è svolta attraverso lezioni
teoriche e lezioni pratiche in laboratorio statistico-informatico nelle quali
si affronteranno analisi su casi empirici mediante l’uso del software SAS.

Il corso ha quale obiettivo la trattazione dei modelli lineari per dati
categoriali secondo due diverse impostazioni. La prima riguarda il
modello lineare generale, ossia i modelli lineari per variabili dipendenti
quantitative continue così detti “a rango non pieno”, poiché includendo
nell’insieme delle variabili esplicative tutte o alcune variabili categoriali la
matrice dei coefficienti del modello contiene colonne linearmente
dipendenti. Quali casi particolari di modello lineare generale si hanno i
modelli ANOVA ad una o più vie e il modello ANCOVA. La seconda
impostazione riguarda i modelli lineari generalizzati secondo l’approccio
di Nelder e Wedderburn, nei quali la variabile risposta ha legge di
distribuzione appartenente alla famiglia esponenziale. Quali casi
particolari si hanno il modello log-lineare di Poisson per dati di conteggio,
i modelli logistici binomiali e multinomiali per risposte nominali o ordinali,
i modelli log-lineari per tabelle di contingenza multidimensionali. Tali
modelli verranno trattati considerando fra le variabili esplicative sia
variabili quantitative sia variabili categoriali. L'attività formativa è svolta
attraverso lezioni teoriche e lezioni pratiche in laboratorio statisticoinformatico
nelle quali si affronteranno analisi su casi empirici mediante l’uso del software SAS.

Contenuti

Modulo MODELLO LINEARE GENERALIZZATO: Modelli lineari generalizzati (GLS); Modello multivariato e Modello SURE;
Modello Multilevel; Correlazione spuria e Path analysis
Esercitazioni con il software SAS: Prof.ssa Nadia Solaro

Modulo MODELLI LINEARI PER DATI CATEGORIALI: Modello lineare generale (GLM); modello ANOVA a una e più vie e modello
ANCOVA; modelli lineari generalizzati (GzLM); modelli logit binomiali e
multinomiali, modelli log-lineari; applicazioni a dati reali e sperimentali
con il software SAS

Programma esteso

Modulo: MODELLO LINEARE GENERALIZZATO
Contenuto 1: Modelli lineari generalizzati con errori eteroschedastici, con
errori correlati, e con errori eteroschedastici e correlati.
Contenuto 2: Modello lineare classico multivariato e modello multivariato
con diverse ipotesi sugli errori. Modello SURE.
Contenuto 3: Modello Multilevel: struttura gerarchica dei dati e diversi tipi
di regressione. Modello lineare con popolazione suddivisa in gruppi.
Analisi varianza a effetti misti. Analisi covarianza. Modello Multilevel:
ipotesi; metodi di stima; interpretazione risultati; diagnostica;
applicazioni.
Contenuto 4: Correlazione spuria e modelli causali. Path analysis: ipotesi;
metodi di stima; interpretazione risultati. Modello strutturale di path
analysis.

Modulo :MODELLI LINEARI PER DATI CATEGORIALI
Contenuto 1: La teoria del modello lineare generale (GLM): specificazione
del modello, ipotesi, soluzione del sistema di equazioni normali mediante
inversa generalizzata, funzioni stimabili e loro proprietà, nozione di
ipotesi testabile. Relazione con il metodo di stima dei minimi quadrati
vincolati: approcci sum-to-zero e set-to-zero linear constraints.
Parametrizzazione degli effetti e parametrizzazione della categoria di
riferimento. Costruzione di contrasti. Procedure di confronto multiplo.
Contenuto 2: Casi particolari di GLM: modelli ANOVA ad effetti fissi a una
e a più vie, modello ANCOVA. Applicazioni a dati reali e sperimentali:
PROC GLM di SAS.
Contenuto 3: Selezione del GLM: metodi forward e stepwise. Applicazioni
a dati reali: PROC GLMSELECT di SAS.
Contenuto 4: Modelli lineari generalizzati (GzLM): legge di distribuzione
della variabile risposta, link function e specificazione del modello, ipotesi,
metodo di stima di massima verosimiglianza, proprietà degli stimatori,
criteri per la valutazione della bontà di adattamento del modello,
intervalli di confidenza e verifica di ipotesi.
Contenuto 5: Casi particolari di GzLM: modello log-lineare di Poisson per
dati di conteggio, modelli logistici binomiali e multinomiali per risposte
nominali e ordinali, modelli log-lineari per tabelle di contingenza
multidimensionali. Applicazioni a dati reali: PROC LOGISTIC e PROC
GENMOD di SAS.

Bibliografia consigliata

Materiale di riferimento:
Materiale del corso disponibile sulla piattaforma e-learning:
http://elearning.unimib.it/.
Testi integrativi:
- Baltagi B. H. (2008), Econometrics, fourth Edition, Springer Berlin
- Dillon W R, Goldstein M (1984). Multivariate Analysis: Methods and
Applications, Wiley
- Snijders T.A.B., Bosker R.J. (1999), Multilevel Analysis – An introduction
to basic and advanced multilevel modelling, SAGE Publications, London
- Srivastava V.K., Giles D.E.A. (1987). Seemingly Unrelated Regression
Equations Models, Marcel Dekker, New York

Materiale di riferimento:
Materiale del corso disponibile sulla piattaforma e-learning:
http://elearning.unimib.it/.
Testi integrativi:
- Agresti, A. (2002), Categorical Data Analysis, Second Edition, New York:
John Wiley & Sons
- Dobson, A. (1990), An Introduction to Generalized Linear Models,
London: Chapman & Hall
- Littell, R. C., Freund, R. J., and Spector, P. C. (2002), SAS for Linear
Models, 4th Edition, Cary, NC: SAS Institute Inc.
- Searle, S. R. (1971), Linear Models, New York: John Wiley & Sons

Metodi didattici

Lezioni teoriche ed esercitazioni in laboratorio statistico-informatico

Contatti/Altre informazioni

Modulo da 6 cfu di “Modelli Statistici I”