Anno di corso: 1

Crediti: 8
Crediti: 6
Crediti: 6
Crediti: 6
Crediti: 6

Anno di corso: 2

Crediti: 12
Tipo: A scelta dello studente
Crediti: 8
Tipo: A scelta dello studente
Crediti: 6
Tipo: A scelta dello studente
Crediti: 4
Tipo: A scelta dello studente
Crediti: 40
Tipo: Lingua/Prova Finale
Crediti: 4
Tipo: Altro

METODOLOGIE BIOINFORMATICHE

Scheda dell'insegnamento

Anno accademico di regolamento: 
2019/2020
Anno di corso: 
1
Anno accademico di erogazione: 
2019/2020
Tipo di attività: 
Obbligatorio a scelta
Lingua: 
Italiano
Crediti: 
6
Ciclo: 
Primo Semestre
Ore di attivita' didattica: 
43
Prerequisiti: 

Prerequisiti. Conoscenze di base di informatica e di biologia molecolare.
Propedeuticità. Nessuna.

Moduli

Metodi di valutazione

Modalita' di verifica dell'apprendimento: 

La verifica finale consiste in una prova orale divisa in due parti. Nella prima parte studente dovrà esporre una breve relazione su un paper scientifico precedentemente fornitogli alla fine del corso. Lo studente è libero di scegliere le modalità di esposizione della sua relazione (slides, report scritto, relazione orale). La seconda parte consiste di 1/2 domande, relativa ai contenuti dell'insegnamento, che verrà valutata tenendo conto della chiarezza espositiva, della completezza delle risposte, e della capacità di collegare i metodi computazionali al problema biologico in esame.

Valutazione: 
Voto Finale

Obiettivi formativi

L'obiettivo principale dell’insegnamento è quello di introdurre gli studenti alle principali problematiche relative all'analisi computazionale di sequenze biologiche (DNA, RNA, proteine). Gli studenti acquisiranno le conoscenze ed i concetti di base relativi alle metodologie e alle tecniche computazionali per la raccolta, la gestione e l'analisi di dati in biologia molecolare, come i dati di sequenze generati dalle tecnologie Next Generation Sequencing, e la padronanza dei principali strumenti computazionali necessari per estrarre informazioni di interesse per la ricerca biomedica dalle principali banche dati di sequenze.

Conoscenza e capacità di comprensione.
Al termine dell'insegnamento lo studente dovrà sviluppare la capacità di scegliere il metodo computazionale più adeguato per la ricerca e l’analisi di specifiche sequenze biologiche, e di discutere in modo critico le caratteristiche dei vari metodi di bioinformatica per la soluzione di diversi problemi basati su dati biomolecolari.

Capacità di applicare conoscenza e comprensione.
Al termine dell'insegnamento lo studente dovrà essere in grado di applicare le conoscenze acquisite per l’analisi di sequenze biologiche e dati biomolecolari.

Autonomia di giudizio.
Al termine dell'insegnamento lo studente dovrà essere in grado di elaborare quanto appreso, e saper riconoscere le situazioni e i problemi in cui le diverse metodologie di bioinformatica apprese possano essere utilizzate per la soluzione di problemi basati su sequenze biologiche e dati biomolecolari.

Abilità comunicative.
Al termine dell'insegnamento lo studente dovrà essere in grado di esprimersi in modo appropriato nella descrizione delle tematiche affrontate, con proprietà di linguaggio e sicurezza di esposizione.

Capacità di apprendimento
Al termine dell'insegnamento lo studente dovrà essere in grado di consultare la letteratura sugli argomenti trattati, nonché analizzare, applicare, integrare e collegare le conoscenze acquisite con quanto verrà appreso in insegnamenti correlati allo studio di dati nelle scienze della vita.

Contenuti

Introduzione alla bioinformatica: motivazioni, problemi e metodologie.
Generazione dei dati: le tecnologie Next Generation Sequencing.
Organizzazione e gestione dei dati: le principali banche dati biologiche; accesso, interrogazione, inserimento e analisi di dati.
Analisi dei dati: ricostruzione e annotazione di genomi; confronto di sequenze: algoritmi di allineamento globale, locale e multiplo; ricostruzione di filogenie; analisi del trascrittoma.

Programma esteso

1. La gestione dei dati nelle scienze della vita

2. L’informatica essenziale
2.1. Algoritmi e programmi
2.2. Alfabeti, parole, grafi
2.3. Basi di dati

3. La tecnologia Next Generation Sequencing (NGS)
3.1. Piattaforme NGS di seconda generazione
3.2. Piattaforme NGS di terza generazione
3.3. Il formato dei dati genomici
3.4. Ricostruzione e annotazione di genomi

4. Basi di dati di sequenze molecolari
4.1. Basi di dati Genomiche (EMBL – GenBank)
4.2. Basi di dati di sequenze proteiche (SwissProt, PDB)
4.3. I sistemi di interrogazione delle basi di dati
4.4. UCSC Genome Browser
4.5. Galaxy

5. Analisi di sequenze in biologia molecolare
5.1. Algoritmi di string matching esatto
5.2. Allineamento di sequenze
5.2.1. Motivazioni
5.2.2. Matrici a punti
5.2.3. Matrici di sostituzione (PAM, BLOSUM)
5.2.4. Allineamento globale: Algoritmo di Needleman-Wunsch
5.2.5. Allineamento locale: Algoritmo di Smith-Waterman
5.2.6. Algoritmi euristici: BLAST, Fasta, BWA
5.2.7. Allineamento multiplo: CLUSTALW

6. Ricerca di motivi funzionali in sequenze
6.1. Alberi di suffissi
6.2. Algoritmi di pattern discovery

7. Analisi del trascrittoma
7.1. Annotazione di geni e trascritti alternativi
7.2. Analisi di dati RNA-seq

8. Evoluzione molecolare: ricostruzione di alberi filogenetici
8.1. Algoritmi di clustering
8.1.1. k-means
8.1.2. Neighbour joining
8.2. UPGMA
8.3. Metodi di massima parsimonia
8.4. Metodi di massima verosimiglianza

Bibliografia consigliata

Slides delle lezioni e delle esercitazioni reperibili sulla pagina e-learning dell'insegnamento.

Testi consigliati: Helmer Citterich M, Ferrè F, Pavesi G, Romualdi C, Pesole G. Fondamenti di bioinformatica. Zanichelli, 2018.

Modalità di erogazione

Convenzionale

Metodi didattici

Lezioni frontali in aula (35 ore, 5 CFU) supportate da slides.
Esercitazioni (8 ore, 1 CFU) in aula di calcolo per l'utilizzo di banche dati biologiche e piattaforme di analisi bioinformatiche (NCBI, UCSC Genome Browser, Galaxy).

Contatti/Altre informazioni

Ricevimento su appuntamento previa richiesta via e-mail al docente.