DATA SEMANTICS

Scheda dell'insegnamento

Anno accademico di regolamento: 
2018/2019
Anno di corso: 
1
Anno accademico di erogazione: 
2018/2019
Tipo di attività: 
Obbligatorio a scelta
Lingua: 
Inglese
Crediti: 
6
Ciclo: 
Secondo Semestre
Ore di attivita' didattica: 
46
Prerequisiti: 

Conoscenze matematiche e informatiche insegnate nei corsi obbligatori del primo semestre.

Moduli

Metodi di valutazione

Tipo di esame: 
Orale
Modalita' di verifica dell'apprendimento: 

Esame finale
Tipo esame: progetto di gruppo con presentazione finale e discussione mediante esame orale sugli argomenti trattati nel corso.

Valutazione: 
Voto Finale

Obiettivi formativi

Scopo principale del corso è fornire agli studenti le conoscenze e competenze necessarie per comprendere e risolvere problemi di interoperabilità semantica in applicazioni di data science, con particolare riferimento a problemi di rappresentazione, riconciliazione e integrazione di dati eterogenei.

Gli argomenti che verranno trattati hanno un duplice scopo: 1) fornire un insieme di strumenti teorici e pratici per rappresentare, organizzare, pubblicare, interrogare, riconciliare, ed esplorare dati e conoscenze in scenari applicativi reali (ampiamente discussi durante le lezioni frontali e affrontati durante le esercitazioni) utilizzando tecnologie semantiche e 2) acquisire le competenze necessarie per comprendere problemi di interoperabilità semantica nuovi e le tecniche necessarie per risolverli adeguatamente indipendentemente dalle particolari tecnologie di riferimento.

Contenuti

Il corso presenta strumenti computazionali per rappresentare, armonizzare e ricostruire la semantica dei dati utilizzati in applicazioni di data science, con particolare attenzione a:

modelli e linguaggi elaborati nell'ambito del web semantico per supportare l'integrazione di dati eterogeni (knowledge graph, data linking, ontologie, RDF, RDFS, OWL);
tecniche per l'integrazione di dati e vocabolari;
tecniche di estrazione delle informazioni da testi (cenni);
modelli di intelligenza artificiale a supporto dell'esplorazione di dati e conoscenze.

Programma esteso

Data Semantics: Semantica dei dati ed applicazioni di data analytics (big data, sorgenti web, formati eterogenei, integrazione di informazioni ed arricchimento semantico, connessione tra dati, knowledge graph)
Knowledge Graph: rappresentazione e interogazione dei dati nel web semantico (RDF, SPARQL, tecnologie semantiche e architettture, rappresentazioni in ambito industriale mediante basi di dati a grafo). Esercitazione su interrogazione di Knowledge Graph pubblici con SPARQL.
Knowledge Graph e Semantica: definizione di vocabolari condivisi mediante ontologie e linguaggi logico-formali (dai vocabolari condivisi alle ontologie, tassonomie, ontologie lessicali, ontologie assiomatiche, ragionamento automatico e semantica, RDFS, OWL, SWRL). Esercitazione su modellazione di ontologie mediante i linguaggi RDFS e OWL.
Rconciliazione semantica I: integrazione di informazioni e riconciliazione semantica, riconciliazione a livello delle istanze e dello schema, estrazione di informazioni (named entity recognition, entity linking, estrazione di relazioni)
Riconciliazione semantica II: riconciliazione di ontologie e vocabolari (ontology matching per allineare ontologie e tassonomie, terminologia e mapping, similarità semantica e combinazione di diverse funzioni di similaritò, selezione dei mapping). Esercitazione su riconciliazione di tassonomie.
Riconciliazione semantica III: riconciliazione a livello dei valori o delle istanze (deduplicazione e record linkage, approcci probabilistici, metriche di distanza e misure di similarità, combinazione e apprendimento di misure di similarità complesse, strategie per la fusione di infromazioni eterogenee, misure di similarità basate su grafi). Esercitazione su riconcilizione di dati con l'aiuto di strumenti esistenti.
Esplorazione di informazioni e conoscenze: tecniche semantiche per l'esplorazione di informazioni (misure di rilevanza, associazioni semantiche, apprendimento attivo di associazioni rilevanti, sistemi di raccomandazione)
Nuovi approcci alla semantica dei dati: approcci semantici guidati dai dati e di frontiera (profilazione semantica di Knowledge Graph, semantica distribuzionale, word embeddings e knowledge graph embeddings)

Bibliografia consigliata

ITA: Tommaso Di Noia, Roberto De Virgilio, Eugenio Di Sciascio, Francesco M. Donini. Semantic Web: tra ontologie e Open Data, Apogeo, 2013.

ENG: Grigoris Antoniou, Paul Groth, Frank van van Harmelen, A Semantic Web Primer, (Third Edition), MIT press, 2012.

Metodi didattici

Lezioni frontali ed esercitazioni con i personal computer degli studenti. Uso della piattaforma Moodle. Seminari su applicazioni delle tecnologie semantiche a problemi reali da parte di experti del mondo dell'industria.