Anno di corso: 1

Anno di corso: 2

Crediti: 6
Crediti: 12
Tipo: A scelta dello studente
Crediti: 33
Tipo: Lingua/Prova Finale

LARGE SCALE DATA MANAGEMENT

Scheda dell'insegnamento

Anno accademico di regolamento: 
2017/2018
Anno di corso: 
2
Anno accademico di erogazione: 
2018/2019
Tipo di attività: 
Obbligatorio a scelta
Lingua: 
Italiano
Crediti: 
6
Ciclo: 
Primo Semestre
Ore di attivita' didattica: 
48
Prerequisiti: 

Conoscenze di base sulla progettazione di basi di dati. Conoscenza del modello entità-relazione (E-R)

Moduli

Metodi di valutazione

Modalita' di verifica dell'apprendimento: 

sviluppo di un progetto di datawarehousing o di big data analisys

Valutazione: 
Voto Finale

Obiettivi formativi

Lo studente acquisirà competenze relative alle attività di (i) analisi e riconciliazione di sorgenti operazionali eterogenee, (ii) progettazione concettuale relativa alla realizzazione di schemi di fatto, (iii) utilizzo architetture di big data per la gestione dei dati

Contenuti

Il termine data warehouse si riferisce ai metodi, alle tecniche e strumenti in grado di aggregare ed elaborare i dati di una organizzazione per condurre analisi di tipo strategico. Nella prima parte del corso verranno presentare le metodologie di progettazione e sviluppo di un data warehouse. Nella seconsa parte del corso si approfondiranno le architetture di big data e la loro relazione con le soluzioni di datawarehouse esistenti. Durante il corso verrano presentati esempi reali da parte di aziende.

Programma esteso

1 "Analisi e riconciliazione di sorgenti operazionali eterogenee:

a. tecniche per la comparazione e l’allineamento di schemi concettuali;

b. tecniche per integrazione e ristrutturazione di schemi concettuali.

2 Progettazione concettuale relativa alla realizzazione di schemi di fatto:

a. il Dimensional Fact Model come modello concettuale grafico per la definizione di

schemi di fatto;

b. metodologia per la definizione di schemi di fatto a partire da schemi E-R.

3 Big data, architetture di ETL e storage per datawarehouse

a. architetture data lake

b. prodotti disponibili per attività di ETL e storage

c. data processing

Bibliografia consigliata

Matteo Golfarelli e Stefano Rizzi. Data Warehouse – Teoria e pratica della progettazione (seconda edizione). McGraw-Hill.

Metodi didattici

Lezioni frontali ed esercitazioni.