INFORMATION RETRIEVAL

Scheda dell'insegnamento

Anno accademico di regolamento: 
2016/2017
Anno di corso: 
2
Anno accademico di erogazione: 
2017/2018
Tipo di attività: 
Obbligatorio a scelta
Crediti: 
6
Ciclo: 
Primo Semestre
Ore di attivita' didattica: 
52
Prerequisiti: 

Nozioni di base di Statistica e di Algebra Lineare.

Moduli

Metodi di valutazione

Tipo di esame: 
Orale
Modalita' di verifica dell'apprendimento: 

Prova scritta e orale separate, realizzazione di un progetto di laboratorio.

Valutazione: 
Voto Finale

Contenuti

Il corso introdurrà le basi formali e le tecniche per la progettazione e la realizzazione di motori di ricerca (Information Retrieval), e per la definizione di sistemi per la raccomandazione di informazioni (Information Filtering).
In particolare saranno presentate tecniche per il trattamento, l'analisi e l'indicizzazione di testi, con accenni all'indicizzazione di documenti multimediali; saranno inoltre presentati alcuni modelli quantitativi per la determinazione della stima (grado, o probabilità) di rilevanza di un documento rispetto alle necessità informative dell'utente. Tra i modelli avanzati verranno presentati i “Language Model”. Verranno inoltre presentate alcune tecniche per la personalizzazione della ricerca.
Il corso introdurrà inoltre altre applicazioni relative alla gestione e all'analisi di testi, quali la collezione e l'analisi di contenuto generato dagli utenti sui Social Media (ad esempio Twitter, Facebook, ecc.). Si presenterà inoltre il problema della valutazione della credibilità del contenuto generato dagli utenti su Web.

Programma esteso

1 "Introduzione all'Information Retrieval (IR) e all'Information Filtering (IF).
• Documenti e necessità informative, e loro rappresentazione.
• Il concetto di rilevanza. Probabilità e parzialità.
• Efficienza, efficacia; valutazione dell'efficacia di un sistema di IR e di un sistema di IF.

2 Introduzione al software open source per la definizione di motori di ricerca

3 Le tecniche di indicizzazione di testi e cenni di tecniche di indicizzazione di documenti multimediali.

4 Modelli di sistemi di Information Retrieval: i modelli base (Booleano, Vettoriale, modelli Probabilistici). Modelli avanzati. Accenni a motori di ricerca per documenti multimediali.
5 I motori di ricerca su Web: crawling, link analysis e altri fattori per la stima della rilevanza di pagine Web.

6 La valutazione dei motori di ricerca.

7 Argomenti avanzati:

• Personalizzazione della ricerca.
• Analisi di contenuto generato dagli utenti.
• La credibilità delle informazioni sul Social Web.

Bibliografia consigliata

Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press, 2008.
John Scott, Social Network Analysis (Third Ed.), SAGE, 2013.

Metodi didattici

Il corso prevede lezioni in aula, ed esercitazioni in laboratorio. Sono previsti seminari tenuti da esperti del settore a livello nazionale e internazionale.