ANALISI DEI DATI

Scheda dell'insegnamento

Anno accademico di regolamento: 
2018/2019
Anno di corso: 
1
Anno accademico di erogazione: 
2018/2019
Tipo di attività: 
Obbligatorio a scelta
Lingua: 
Italiano
Crediti: 
6
Ciclo: 
Primo Semestre
Ore di attivita' didattica: 
56
Prerequisiti: 

Il candidato deve possedere una conoscenza di base dell’uso del personal computer.

Moduli

Metodi di valutazione

Modalita' di verifica dell'apprendimento: 

.Prova scritta (Biostatistica 6 domande chiuse, 2 aperte) e orale (Bioinformatica)

Valutazione: 
Voto Finale

Obiettivi formativi

Acquisizione della conoscenza delle tecniche computazionali di base per l'analisi e l'elaborazione di dati nell'ambito della biologia molecolare, in particolare dati genomici NGS.
Acquisizione della conoscenza delle principali banche dati di sequenze.
Acquisizione delle conoscenze di base dei principali di strumenti statistico-metodologici della statistica descrittiva e inferenziale per la programmazione degli esperimenti, l’analisi dei dati, la lettura della letteratura scientifica. Il candidato sarà in grado di: comprendere aspetti basilari del disegno dello studio, implementare autonomamente analisi statistiche di base, leggere con spirito critico la letteratura scientifica che presenti analisi statistiche descrittive e inferenziali.

Contenuti

Il corso si propone di contribuire alla formazione di un biotecnologo medico che sia in grado di:
1) compiere ricerche nelle banche dati di interesse biomedico
2) conoscere la tecnologia NGS ed i processi di modellazione/simulazione di processi biologici
3) comprendere i principi del disegno sperimentale in medicina e biologia
4) conoscere le principali tecniche di analisi statistica dei dati
5) Utilizzare un software per l’elaborazione dei dati
6) compiere l'interpretazione critica dei risultati presentati nella letteratura scientifica.

Programma esteso

Il modulo di Bioinformatica prevede una prima parte dedicata alla generazione di dati di sequenza con tecnologie NGS ed alla loro gestione in banche dati pubbliche, ed una seconda parte dedicata ai principali problemi di analisi di questi dati attraverso algoritmi efficienti.

1) Il ruolo dei dati nelle scienze della vita
2) Generazione di dati genomici: la tecnologia NGS
3) Banche dati di interesse biomedico: Struttura, formati, strumenti di accesso
4) Allineamento di sequenze, Motivazioni, Matrici a punti, Matrici di sostituzione PAM, BLOSUM, Allineamento globale: Algoritmo di Needleman-Wunsch, Allineamento locale: Algoritmo di Smith-Waterman, Algoritmi euristici: Blast,Fasta, BWA, Allineamento multiplo.
5) Systems biology e systems medicine: modellazione e simulazione di processi biologici.

Il modulo di Biostatistica si articola in tre parti: la prima relativa alla statistica descrittiva, la seconda alla statistica inferenziale, la terza relativa all’interpretazione di articoli scientifici. Le parti prima e seconda presentano le seguenti caratteristiche:
1) includono aspetti metodologici di disegno dello studio e programmazione dell’esperimento
2) vengono erogate nella forma di riflessione su particolari esempi applicativi
3) prevedono l’uso del pacchetto applicativo per l’analisi dei dati R (freeware)

Parte prima - Generalità sulla statistica descrittiva, Principali rappresentazioni tabellari e grafiche di dati variabili qualitative e quantitative, Indicatori di ordine di grandezze e dispersione di un fenomeno, Distribuzione Gaussiana, Elementi di calcolo delle probabilità

Parte seconda - Generalità sulla statistica inferenziale, Verifica di ipotesi nulle relative alla media di variabili continue, Test T in disegno semplice ed appaiato, Verifica di ipotesi nulle relative alla associazione per variabili categoriali, Test chi quadrato, Verifica di ipotesi nulle relative alla proporzione di variabili dicotomiche: Test McNemar, Cenni all’analisi della varianza, Studio della potenza del test e calcolo della dimensione del campione.

Parte terza - Lettura, interpretazione, riflessione metodologica basata su articoli scientifici.

Bibliografia consigliata

Bioinformatica
1) S. Pascarella, A. Paiardini, Bioinformatica (Zanichelli)
2) Materiale fornito dal docente

Biostatistica
1) M.M. Triola, M.F. Triola
Fondamenti di statistica per le discipline biomediche
2) Materiale fornito dal docente

Metodi didattici

Lezioni frontali ed esercitazioni.

Contatti/Altre informazioni

-