MODELLI LINEARI PER DATI CATEGORIALI

Scheda dell'insegnamento

Anno accademico di regolamento: 
2016/2017
Anno di corso: 
1
Anno accademico di erogazione: 
2016/2017
Tipologia di insegnamento: 
Caratterizzante
Tipo di attività: 
Obbligatorio
Settore disciplinare: 
STATISTICA (SECS-S/01)
Docenti: 
Crediti: 
6
Ciclo: 
Annualita' Singola
Modulo/partizione di: 
Ore di attivita' didattica: 
42
Prerequisiti: 

Per questa attività formativa è indispensabile la conoscenza degli argomenti trattati nei corsi di base di Analisi Statistica Multivariata.

Metodi di valutazione

Modalita' di verifica dell'apprendimento: 

L'esame consiste di una prova scritta ed un’analisi di casi empirici.

Valutazione: 
Voto Finale

Obiettivi formativi

Il corso ha quale obiettivo la trattazione dei modelli lineari per dati categoriali secondo due diverse impostazioni. La prima riguarda il modello lineare generale, ossia i modelli lineari per variabili dipendenti quantitative continue così detti “a rango non pieno”, poiché includendo nell’insieme delle variabili esplicative tutte o alcune variabili categoriali la matrice dei coefficienti del modello contiene colonne linearmente dipendenti. Quali casi particolari di modello lineare generale si hanno i modelli ANOVA ad una o più vie e il modello ANCOVA. La seconda impostazione riguarda i modelli lineari generalizzati secondo l’approccio di Nelder e Wedderburn, nei quali la variabile risposta ha legge di distribuzione appartenente alla famiglia esponenziale. Quali casi particolari si hanno il modello log-lineare di Poisson per dati di conteggio, i modelli logistici binomiali e multinomiali per risposte nominali o ordinali, i modelli log-lineari per tabelle di contingenza multidimensionali. Tali modelli verranno trattati considerando fra le variabili esplicative sia variabili quantitative sia variabili categoriali. L'attività formativa è svolta attraverso lezioni teoriche e lezioni pratiche in laboratorio statistico-informatico nelle quali si affronteranno analisi su casi empirici mediante l’uso del software SAS.

Contenuti

Modello lineare generale (GLM); modello ANOVA a una e più vie e modello ANCOVA; modelli lineari generalizzati (GzLM); modelli logit binomiali e multinomiali, modelli log-lineari; applicazioni a dati reali e sperimentali con il software SAS

Programma esteso

Contenuto 1: La teoria del modello lineare generale (GLM): specificazione del modello, ipotesi, soluzione del sistema di equazioni normali mediante inversa generalizzata, funzioni stimabili e loro proprietà, nozione di ipotesi testabile. Relazione con il metodo di stima dei minimi quadrati vincolati: approcci sum-to-zero e set-to-zero linear constraints. Parametrizzazione degli effetti e parametrizzazione della categoria di riferimento. Costruzione di contrasti. Procedure di confronto multiplo.

Contenuto 2: Casi particolari di GLM: modelli ANOVA ad effetti fissi a una e a più vie, modello ANCOVA. Applicazioni a dati reali e sperimentali: PROC GLM di SAS.

Contenuto 3: Selezione del GLM: metodi forward e stepwise. Applicazioni a dati reali: PROC GLMSELECT di SAS.

Contenuto 4: Modelli lineari generalizzati (GzLM): legge di distribuzione della variabile risposta, link function e specificazione del modello, ipotesi, metodo di stima di massima verosimiglianza, proprietà degli stimatori, criteri per la valutazione della bontà di adattamento del modello, intervalli di confidenza e verifica di ipotesi.

Contenuto 5: Casi particolari di GzLM: modello log-lineare di Poisson per dati di conteggio, modelli logistici binomiali e multinomiali per risposte nominali e ordinali, modelli log-lineari per tabelle di contingenza multidimensionali. Applicazioni a dati reali: PROC LOGISTIC e PROC GENMOD di SAS.

Bibliografia consigliata

Materiale di riferimento:
Materiale del corso disponibile sulla piattaforma e-learning:
http://elearning.unimib.it/.

Testi integrativi:
- Agresti, A. (2002), Categorical Data Analysis, Second Edition, New York: John Wiley & Sons
- Dobson, A. (1990), An Introduction to Generalized Linear Models, London: Chapman & Hall
- Littell, R. C., Freund, R. J., and Spector, P. C. (2002), SAS for Linear Models, 4th Edition, Cary, NC: SAS Institute Inc.
- Searle, S. R. (1971), Linear Models, New York: John Wiley & Sons

Metodi didattici

Lezioni teoriche ed esercitazioni in laboratorio statistico-informatico

Contatti/Altre informazioni

Modulo da 6 cfu di “Modelli Statistici I”