DATA SEMANTICS

Scheda dell'insegnamento

Anno accademico di regolamento: 
2017/2018
Anno di corso: 
1
Anno accademico di erogazione: 
2017/2018
Tipo di attività: 
Obbligatorio a scelta
Crediti: 
6
Ciclo: 
Secondo Semestre
Ore di attivita' didattica: 
52
Prerequisiti: 

Basi di dati relazionali e NoSQL. Fondamenti di SQL.

Moduli

Metodi di valutazione

Tipo di esame: 
Orale
Modalita' di verifica dell'apprendimento: 

Verifica finale o progetto

Valutazione: 
Voto Finale

Obiettivi formativi

Conoscenza e comprensione
Alla fine del corso lo studente apprenderà come: modellare e interrogare dati in RDF usando o creando appositi vocabolari o ontologie in RDFS, costruire algoritmi per la riconciliazione dei dati usando misure di similarità semantica; usare modelli semantici dei dati per connettere e analizzare dati di varia natura (tabelle, testi, etc.)

Capacità di applicare conoscenza e comprensione
Alla fine del corso lo studente sarà in grado di: creare o estendere un KG a partire da più insiemi di dati tabellari, linkando questi dati a KG di riferimento; arricchire un insieme di dati di partenza usando dati provenienti da altri KG.

Contenuti

1) Data semantics: dai modelli concettuali alla gestione concettuale dei dati (interpretazione, modelli concettuali, metadata).
2) Gestione concettuale dei dati mediante Knowledge Graphs (KG) (KG come astrazione; RDF e tecnologie semantiche; vocabolari, classificazioni, ontologie).
3) Modellazione semantica dei dati (modellare e interrogare dati con RDF e RDFS).
4) Integrazione e arricchimento dei dati attraverso la semantica (matching su schemi e istanze, misure di similarità, linking e fusione dei dati, elaborazione semantica dei testi).

Programma esteso

1. Data semantics: dai modelli concettuali alla gestione concettuale dei dati
a. Introduzione: semantica e interpretazione
b. Modelli concettuali: ER e UML
c. Metadata e vocabolari
2. Gestione concettuale dei dati: Knowledge Graph (KG) e oltre
a. KGs come astrazioni
b. KGs in RDF e con tecnologie semantiche
c. KGs e sistemi di gestione documentale
d. Vocabolari, classificazioni, ontologie
3. Semantic data modeling
a. Modellazione dei dati in RDF e interrogazione con SPARQL
b. Basi di rappresentazione della conoscenza per RDF mediante RDFS
4. Lab I: Creazione di dati semantici attraverso mapping di tabelle su KG
5. Integrazione semantica dei dati
a. Riconciliare i dati
b. Matching su schemi e istanze
c. Misure di similarità, incertezza e decisione in metodi di mapping
6. Arricchimento semantico di dati sorgente
a. Data linking
b. Data fusion
c. Linkare testi a KG
7. Lab I: Integrazione e arricchimento di un insieme di dati sorgente in format tabellare

Bibliografia consigliata

Tommaso Di Noia, Roberto De Virgilio, Eugenio Di Sciascio, Francesco M. Donini. Semantic Web: tra ontologie e Open Data, Apogeo, 2013.

Metodi didattici

Lezioni ed esercitazioni al computer.