Introduzione alla chemiometria: Obiettivi, metodi e applicazioni della chemiometria. Le strutture dei dati multivariati. Parametri statistici elementari: indici di posizione e di dispersione; covarianza e correlazione.
Strategie per la razionalizzazione di problemi complessi.
Metodi per l'esplorazione dei dati: l'analisi delle componenti principali. Similarità e diversità: i concetti di analogia, similarità, dissimilarità e distanza. Il concetto di centroide e di centrotipo. Metodi gerarchici divisivi e agglomerativi. Metodi non gerarchici. Strategie per l'analisi di similarità.
Il concetto di bias e i metodi di validazione: stimatori statistici; bias e varianza. Modelli descrittivi e predittivi. Tecniche di validazione dei modelli (cross-validation, bootstrap, ecc.).
Metodi di regressione: strategie di ricerca basate su modelli quantitativi e parametri di regressione. L'analisi di regressione multipla. I metodi di regressione biased: i metodi ridge, la selezione dei migliori sottomodelli, metodi di analisi in componenti principali.
Metodi di classificazione: strategie di ricerca basate sulla classificazione e parametri di classificazione. Il metodo k-nn. Le probabilità bayesiane e i metodi di analisi discriminante. Metodi di classificazione ad albero.
Relazioni tra struttura molecolare, proprietà chimico-fisiche/attività biologiche (QSAR): introduzione alle metodologie QSAR. Metodologie QSAR e descrittori molecolari: descrittori costituzionali, topologici, geometrici.