Anno di corso: 1

Anno di corso: 2

Crediti: 6
Crediti: 6
Crediti: 6
Crediti: 6
Crediti: 6
Crediti: 6
Crediti: 12
Tipo: A scelta dello studente
Crediti: 3
Tipo: Lingua/Prova Finale
Crediti: 33
Tipo: Lingua/Prova Finale

INFORMATION RETRIEVAL

Scheda dell'insegnamento

Anno accademico di regolamento: 
2015/2016
Anno di corso: 
2
Anno accademico di erogazione: 
2016/2017
Tipo di attività: 
Obbligatorio a scelta
Crediti: 
6
Ciclo: 
Primo Semestre
Ore di attivita' didattica: 
52
Prerequisiti: 

Nozioni di base di Statistica e di Algebra Lineare.

Moduli

Metodi di valutazione

Tipo di esame: 
Orale
Modalita' di verifica dell'apprendimento: 

Prova scritta ed orale separate, realizzazione di un progetto di laboratorio.

Valutazione: 
Voto Finale

Obiettivi formativi

L'obiettivo del corso è fornire un'introduzione ai concetti fondamentali, ai modelli formali, e alle tecniche per la realizzazione di sistemi per il reperimento automatico di documenti in forma digitale (sistemi di "Information Retrieval", detti Motori di Ricerca o Motori di Ricerca su Web quando i documenti da reperire sono costituiti da pagine Web) e per la raccomandazione di informazioni (sistemi di "Information Filtering"). In questo contesto il principale problema da affrontare è quello della valutazione della rilevanza dei documenti rispetto alle necessità informative dell'utente. Al termine del corso lo studente sarà in grado di progettare tecniche per il reperimento, il trattamento e l'indicizzazione di testi semi-strutturati, e di utilizzare software "open source" per la definizione di applicazioni di Information Retrieval. Il laboratorio sarà finalizzato alla realizzazione di una applicazione.

Contenuti

Il corso introdurrà un insieme di tecniche per la progettazione e la realizzazione di motori di ricerca, e per la definizione di sistemi per la raccomandazione di informazioni (Information Filtering).
In particolare saranno presentate tecniche per il trattamento, l'analisi e l'indicizzazione di testi, con accenni all'indicizzazione di documenti multimediali; saranno inoltre presentati alcuni modelli quantitativi per la determinazione della stima (grado, o probabilità) di rilevanza di un documento rispetto alle necessità informative dell'utente. Tra i modelli avanzati verranno presentati i “Language Model”. Verranno inoltre presentate alcune tecniche per la personalizzazione della ricerca.
Il corso introdurrà inoltre altre applicazioni relative alla gestione e all'analisi di testi, quali la collezione e l'analisi di contenuto generato dagli utenti sui Social Media (ad esempio Twitter, Facebook, ecc.). Si presenterà inoltre il problema della valutazione della credibilità del contenuto generato dagli utenti su Web.

Programma esteso

1 "Introduzione all'Information Retrieval (IR) e all'Information Filtering (IF).
• Documenti e necessità informative, e loro rappresentazione.
• Il concetto di rilevanza. Probabilità e parzialità.
• Efficienza, efficacia; valutazione dell'efficacia di un sistema di IR e di un sistema di IF.

"

2 Introduzione al software open source per la definizione di motori di ricerca

3 Le tecniche di indicizzazione di testi e cenni di tecniche di indicizzazione di documenti multimediali.

4 Modelli di sistemi di Information Retrieval: i modelli base (Booleano, Vettoriale, modelli Probabilistici). Modelli avanzati. Information Retrieval di documenti strutturati e multimediali.

5 I motori di ricerca su Web: crawling, link analysis e altri fattori per la stima della rilevanza di pagine Web.

6 La valutazione dei motori di ricerca.

7 Argomenti avanzati:
• Personalizzazione della ricerca. • Analisi di contenuto generato dagli utenti. • La credibilità delle informazioni sul Social Web.

Bibliografia consigliata

Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008. John Scott, Social Network Analysis (Third Ed.), SAGE, 2013.

Metodi didattici

Il corso prevede lezioni in aula, ed esercitazioni in laboratorio. Sono previsti seminari tenuti da esperti del settore a livello nazionale ed internazionale.