Specifiche sul corso

Area del corso: 
Dipartimento: 
DIPARTIMENTO DI INFORMATICA, SISTEMISTICA E COMUNICAZIONE
Tipo di corso: 
Corso di Laurea Magistrale
Anno accademico: 
2017/2018
Durata in anni: 
2
Sede: 
MILANO
Modalita' didattica dell'ordinamento: 
Convenzionale

Norme per l'accesso

Il Corso di Laurea magistrale in Data Science è rivolto a studenti che:
- abbiano conseguito la laurea o il diploma universitario di durata triennale, ovvero altro titolo di studio conseguito all'estero, riconosciuto idoneo, purchè abbiano acquisito almeno 30 CFU complessivi nei seguenti Settori Scientifico-Disciplinari:
- INF/01;
- ING-INF/05;
- da SECS-S/01 a SECS-S/06;
- da MAT/01 a MAT/09;
- da FIS/01 a FIS/08.

-siano in possesso di una certificazione della conoscenza della lingua inglese, rilasciata dall'Ateneo o da Ente accreditato dall'Ateneo, corrispondente al livello B2 o superiore.

Modalità di ammissione

L'adeguatezza della preparazione personale sarà verificata mediante un colloquio.
Il colloquio verterà sulle conoscenze di base di informatica, matematica, statistica, fisica, e avrà lo scopo di dimostrare, da parte dello studente, di possedere le competenze necessarie per seguire con profitto gli studi. Inoltre il colloquio avrà lo scopo, da parte dei docenti, di suggerire l'opportunità di percorsi di approfondimento disciplinare.

Le date e le modalità di svolgimento del colloquio saranno pubblicate sul sito del Dipartimento di Informatica, Sistemistica e Comunicazione http://www.disco.unimib.it.

Obiettivi formativi e competenze attese

Gli obiettivi formativi del Corso di Laurea magistrale in Data Science si sostanziano in una offerta didattica interdisciplinare che integra contributi nella statistica, nella informatica e nelle discipline giuridiche, sociali ed economiche.

Le caratteristiche di interdisciplinarietà sono motivate dal carattere pervasivo che i dati stanno sempre più assumendo nelle tematiche di ricerca, nei servizi, nell'industria, nella economia, nella pubblica amministrazione. La laurea magistrale è perciò adatta a essere fruita da studenti che abbiano conseguito la laurea di primo livello potenzialmente in tutte le classi di laurea, purchè abbiano acquisito una soglia minima di crediti formativi nei settori della informatica, statistica, matematica, fisica.

In particolare, il percorso formativo in Data Science fornisce le conoscenze scientifiche e professionali adeguate all' utilizzo di tecniche statistiche, tecnologie informatiche e ambienti applicativi per la acquisizione, integrazione, gestione, analisi e visualizzazione di dataset digitali di grandi dimensioni. Tali dataset sono potenzialmente caratterizzati dalle quattro caratteristiche spesso richiamate per i Big Data (vedi il Rapporto “BigData@MIUR”, prima edizione 2016), corrispondenti al volume, la velocità, la varietà, il valore.

Il Corso di Laurea magistrale ha un respiro internazionale, favorisce scambi di studenti e docenti, prevede insegnamenti obbligatori erogati in lingua inglese e prevede una soglia di ingresso per la conoscenza della lingua inglese.

Gli obiettivi formativi specifici sono:
1. Fornire conoscenze avanzate sull'uso di tecniche statistiche e tecnologie informatiche al fine di migliorare la qualità dei processi decisionali e operativi basati su dati digitali nel settore pubblico e nel settore privato.
2. Fornire gli strumenti per abilitare e accelerare la innovazione tecnologica in un insieme potenzialmente vasto di domini applicativi, in cui i dati digitali possono essere sfruttati per nuovi metodi di ricerca e scoperte scientifiche, più efficienti processi produttivi, più efficace gestione ed erogazione di servizi pubblici.
3. Fornire metodi e tecniche utilizzabili in gruppi interdisciplinari in cui operino insieme esperti in Data Science ed esperti in specifici domini applicativi.
4. Creare professionisti in grado di operare e competere nel contesto nazionale e internazionale.

Per raggiungere tali obiettivi, il Corso di laurea magistrale è strutturato in due aree formative, i cui insegnamenti si collocano negli ambiti disciplinari caratterizzanti il corso di laurea magistrale.

a. Area statistica e informatica - Riguarda tre tematiche:

a1. Fondamenti delle tecniche statistiche e tecnologie informatiche. Nell'ambito delle quattro caratteristiche richiamate per i Big Data, in questa area si esplora il volume, fornendo metodologie e linguaggi per organizzare, esplorare, interrogare, analizzare dataset digitali anche di grandi dimensioni.

a2. Tecniche statistiche e tecnologie informatiche specialistiche, negli ambiti dell'apprendimento automatico e dei modelli decisionali, focalizzate sul volume dei dataset e sul valore del processo decisionale.

a3. Tecniche statistiche e tecnologie informatiche applicate a dataset caratterizzati da velocità, varietà di formato e di significato, complessità e incertezza. Vengono approfondite tutte e quattro le dimensioni citate in precedenza per i Big Data, applicate a:
- analisi dei dati e modelli interpretativi, predittivi e prescrittivi per problemi decisionali e operativi nel pubblico, nel privato, nella ricerca;
- studio di soluzioni e modelli che accrescano il valore economico, sociale e pubblico dei dati.

b. Area delle discipline sociali, giuridiche ed economiche su tematiche relative a:

- lo sviluppo della economia digitale;
- l'impatto dei dati digitali sulla società;
- gli aspetti di innovazione giuridica inerenti le tecnologie digitali.

Il percorso formativo prevede insegnamenti e attività di laboratorio obbligatori per tutti gli studenti nei tre ambiti disciplinari caratterizzanti la classe di laurea magistrale, a. tecnologie informatiche, b. aziendale organizzativo, c. discipline umane, sociali, giuridiche ed economiche.

Lo studente può inoltre scegliere insegnamenti e attività di laboratorio disciplinari affini e integrativi. In virtù del carattere interdisciplinare della laurea magistrale, gli insegnamenti di laboratorio affrontano un esteso insieme di tematiche applicative, quali le scienze della vita (biologia, genomica e medicina), l'economia, il marketing, il territorio, l'ambiente, il mondo fisico, la sicurezza, l'Internet delle cose. Ciò spiega l'esteso numero di settori scientifico disciplinari affini e integrativi.

Il percorso formativo si completa con attività a scelta dello studente, uno stage obbligatorio e la prova finale. Lo stage e la prova finale offrono la possibilità allo studente di approfondire nel mondo della produzione di beni e servizi e della Pubblica Amministrazione le tematiche affrontate negli insegnamenti e nelle attività di laboratorio.

La scelta strategica insita nel percorso formativo delineato è quella di coinvolgere intensamente lo studente nella applicazione delle tecniche e tecnologie a casi reali. Si mira a favorire così un percorso di “transizione università-lavoro” che si attua di fatto nel corso stesso del percorso formativo.

La precedente organizzazione del percorso formativo permette di raggiungere gli obiettivi formativi specifici delineati. A titolo esemplificativo, un percorso formativo adeguato a tutte le figure professionali prevede:
- insegnamenti sui fondamenti della statistica e informatica;
- insegnamenti specialistici e applicativi in statistica e informatica;
- insegnamenti nelle discipline sociali, giuridiche e economiche;
- attività di laboratorio in un dominio applicativo a scelta;
- insegnamenti a scelta dello studente;
- stage presso azienda operante nel dominio applicativo precedentemente scelto;
- tesi presso azienda per perfezionamento del progetto iniziato nello stage.

Risultati di apprendimento attesi, espressi tramite i descrittori europei del titolo di studio:

Conoscenza e comprensione, e Capacità di applicare conoscenza di comprensione: Sintesi

Conoscenza e capacità di comprensione
Le conoscenze e competenze disciplinari specifiche del corso di studi che ogni studente deve possedere nel momento in cui consegue il titolo vanno riferite ai quattro obiettivi specifici descritti in precedenza e alle caratteristiche dei dataset digitali (volume, velocità, varietà, valore).

Gli strumenti didattici con cui i risultati attesi vengono conseguiti riguardano le due aree formative descritte negli obiettivi, ed in particolare:

Fondamenti della statistica e informatica - Conoscenza e comprensione di modelli, tecniche e metodologie statistiche per la analisi di dataset e delle tecnologie informatiche per la acquisizione, gestione e elaborazione di dataset potenzialmente di grandi dimensioni, la loro interrogazione, aggregazione e visualizzazione (obiettivi 1 e 3).

Statistica e informatica specialistica - Conoscenza e comprensione delle tecniche di apprendimento automatico per dataset di grandi dimensioni e modelli decisionali (obiettivi 1 e 2).

Statistica e informatica applicata - Conoscenza e comprensione delle tecniche statistiche e tecnologie informatiche più avanzate per:
a. la gestione e analisi dei dataset di grandi dimensioni, i flussi di dati in streaming, caratterizzati da eterogeneità (es. dati tabellari, testi, immagini), complessità e incertezza;
b. la modellazione semantica e integrazione di fonti di dati eterogenee;
c. l'apprendimento supervisionato e non supervisionato (obiettivi 2 e 3).

Discipline sociali, giuridiche ed economiche - Conoscenza e comprensione delle tematiche di impatto sociale, giuridico ed economico del processo di digitalizzazione dei dati (obiettivi 1 e 4).

Gli strumenti didattici con cui viene verificato il conseguimento degli obiettivi sono:
- gli esami di profitto
- relazioni a seguito di insegnamenti di laboratorio, lavori di gruppo o stage.

Capacità di applicare conoscenza e comprensione

Le capacità di applicare conoscenza e comprensione riguardano le tecniche statistiche e le tecnologie informatiche applicate, nei seguenti aspetti:

- capacità di effettuare analisi mirate su diversi tipi di dataset quali gli streaming data, i dati tabellari, i documenti e le immagini e analisi su insiemi congiunti di dataset.
- capacità di applicare i temi di apprendimento supervisionato e non supervisionato e di modellazione, estrazione, integrazione, analisi e valorizzazione della conoscenza; tali capacità sono acquisite in vari domini applicativi di interesse delle aziende, delle Pubbliche Amministrazioni e della ricerca.

Le esperienze acquisite nelle attività di laboratorio e nello stage, insieme alla prova finale, completano il percorso di applicazione delle conoscenze acquisite alle realtà del lavoro pubblico e privato e della ricerca, contribuendo a raggiungere in questo modo gli obiettivi 1, 2, 3 e 4.

Gli strumenti didattici con cui viene verificata la capacità di applicare conoscenza e comprensione sono:
- gli esami di profitto, con particolare riferimento a domande scritte e orali concernenti esercizi progettuali in cui gli studenti devono applicare le tecniche e tecnologie apprese.
- relazioni ed elaborati prodotti a seguito di insegnamenti di laboratorio, lavori di gruppo o stage.

Conoscenza e comprensione, e Capacità di applicare conoscenza di comprensione: Dettaglio

Area statistica e informatica

Conoscenza e comprensione
L'area di apprendimento include:
a. i modelli, le tecniche, le metodologie statistiche per l'analisi di dataset di grandi dimensioni in condizioni di incertezza, al fine di garantire l'utilità, qualità ed efficacia dell'analisi. La conoscenza riguarda il calcolo delle probabilità e la statistica, le tecniche statistiche per l'analisi dei dati e le metodologie statistiche per dataset di grandi dimensioni e per serie storiche.
b. le tecnologie, le tecniche e metodologie informatiche per la acquisizione, gestione, integrazione, analisi di dataset di grandi dimensioni, al fine di garantire la scalabilità rispetto al volume e alla velocità di acquisizione dei dataset e la gestione delle eterogeneità presenti nei dataset. La conoscenza riguarda in particolare i sistemi di gestione di basi di dati e di dataset di grandi dimensioni e le relative tecniche di visualizzazione, i modelli e linguaggi per esprimere la semantica dei dati, le tecniche di apprendimento, i modelli decisionali, l'organizzazione dei sistemi informativi, le tecniche di ricerca sul Web, le tecniche di gestione di flussi di dati.

Capacità di applicare conoscenza e comprensione
L'area di apprendimento prevede la capacità di:
a. utilizzare in modo integrato tecniche e metodologie statistiche e informatiche, al fine di costruire soluzioni applicative efficienti. Saranno scelti ambienti e linguaggi di larga diffusione, versatilità e apertura (ad esempio l'ambiente R e il linguaggio Python). Non vi saranno specifici insegnamenti dedicati ad ambienti e linguaggi; la loro organizzazione, architettura e sintassi saranno descritte negli insegnamenti di statistica e di informatica, così da venire immediatamente applicati in casi reali;

b. applicare tecniche statistiche e tecniche e tecnologie informatiche per l'elaborazione di approfondimenti e casi di studio in domini applicativi di ampia diffusione, quali il marketing su Web, la sicurezza in rete, l'elaborazione di segnali e immagini, i social media, la progettazione di servizi basati su dati digitali, la business intelligence.

Le conoscenze e capacità sono conseguite e verificate nelle seguenti attività formative:

- Data management and visualization, modulo Data management e modulo Data visualization (ING-INF/05) - esame unico- 12 CFU;
- Foundations of computer science (INF/01) - 6 CFU;
- Foundations of probability and statistics (SECS-S/01) - 6 CFU;
- Data semantics (INF/01) - 6 CFU;
- Digital signal and image management (INF/01) - 6 CFU;
- Information systems (ING-INF/05) - 6 CFU;
- Machine learning and decision models, modulo Machine learning (INF/01) e modulo Decision model (MAT/09) - esame unico - 12 CFU;
- Statistical modeling (SECS-S/01) - 6 CFU;
- Technological infrastructures for data science (ING-INF/05) - 6 CFU;
- Text mining and search (INF/01) - 6 CFU;
- Cybersecurity for data science (INF/01) - 6 CFU;
- Data science lab (SECS-S/01) - 6 CFU;
- Social media analytics (INF/01) - 6 CFU;
- Service science (ING-INF/05) - 6 CFU;
- Business intelligence (ING-INF/05) - 6 CFU;
- High dimensional data analysis (SECS-S/03) - 6 CFU;
- Streaming data management and time series analysis (SECS-S/03) - 6 CFU;
- Data science lab in environment and physics, modulo Big Data in Geographic information systems (GEO/04) e modulo Big data management and analysis in physics research (FIS/01), esame unico - 6 CFU;
- Data science lab in biosciences, modulo Big data in biotechnology & biosciences (INF/01) e modulo Making sense of biological data (BIO/05), esame unico - 6 CFU;
- Data science lab in medicine, modulo Big Data in health Care (MED/01) e modulo Medical imaging & big data (ING-INF/06), esame unico - 6 CFU;
- Industry lab (ING-INF/05) - 6 CFU.

Area delle discipline sociali, giuridiche ed economiche

Conoscenza e comprensione
L'area di apprendimento include:
a. le tematiche sociali e giuridiche, approfondendo i temi su co-evoluzione delle tecnologie e della società, l'etica della informazione, i limiti delle tecnologie della informazione, i temi di accessibità ai dati digitali nel pubblico e nel privato, negli aspetti dei dati come beni comuni, del copyright e della tutela della privacy.
b. i temi economici, trattando sia il tema delle tecniche e metodologie statistiche e informatiche per applicazioni alla economia e alla finanza, sia il tema della economia dei dati digitali e il suo impatto su lavoro e sulla produzione dei beni e servizi.

Capacità di applicare conoscenza e comprensione
Verranno presi in considerazione diversi casi di studio su aspetti etici, giuridici ed economici, mostrando sia casi di insuccesso, sia buone pratiche, facendo svolgere un ruolo attivo agli studenti, mostrando loro gli scenari applicativi e esaminando l'evoluzione degli studi di caso.
A titolo esemplificativo, verrà mostrato come venga comparativamente trattato il tema della privacy individuale e di gruppi di persone in diversi paesi e organizzazioni, analizzando anche i limiti della attuale legislazione.

Le conoscenze e capacità sono conseguite e verificate nelle seguenti attività formative:

- Juridical and social issues in information society (IUS/09), 6 CFU;
- Economics for data science, modulo Big data in economics e modulo Digital economy (SECS-P/05), esame unico - 6 CFU;
- Web marketing and communication management (SECS-P/08), 6 CFU;
- Data science lab in business and marketing, modulo Big data in business, economics and society (SECS -S/03) e modulo Big data in behavioural psycology (M-PSI/03), esame unico - 6 CFU;
- Data science lab in public policies and services, modulo Big data in public health (MED/01) e modulo Data in public and social services (ING-INF/05), esame unico - 6 CFU;
- Industry lab (ING-INF/05), 6 CFU.

Autonomia di giudizio
Gli insegnamenti adottano un metodo di apprendimento basato sulla partecipazione attiva dello studente al processo di acquisizione dei concetti. Tale metodo di insegnamento favorisce la crescita cognitiva autonoma e l'autonomia di giudizio. Tali concetti saranno applicati in domini di interesse delle aziende private e delle pubbliche amministrazioni e aree di ricerca scientifica; ciò avverrà nei singoli insegnamenti, nelle attività di laboratorio, nello stage e prova finale.
Viene favorita in tal modo la acquisizione di un atteggiamento critico orientato alla scelta dei criteri decisionali e delle metodologie, tecniche e tecnologie più adatte alla soluzione di problemi specifici e a classi di problemi.
Si favorisce inoltre una riflessione critica sui temi economici, sociali, giuridici ed etici, e sull'impatto concreto delle soluzioni individuate sulla società e sul singolo.
La verifica della autonomia di giudizio è condotta attraverso esami orali ed analisi degli elaborati progettuali, sia nell'ambito dei singoli insegnamenti che nella prova finale.

Abilità comunicative
Le abilità comunicative sono acquisite attraverso:
- la sperimentazione e discussione critica di progetti sviluppati in gruppo, che promuovono capacità di comunicazione e collaborazione con soggetti che svolgono funzioni diversificate.
- la esperienza pratica e la discussione dei risultati ottenuti nello stage e nella prova finale.
Ulteriori aspetti che estendono le capacità comunicative sono l'adozione per alcuni insegnamenti dell'inglese come lingua parlata e scritta, e lo sviluppo del tema della visualizzazione, che è centrale nella fase finale e più critica del ciclo di vita del dato digitale, quando i risultati della analisi devono essere considerati e presentati attraverso la loro rappresentazione simbolica/visuale.
La verifica delle abilità comunicative avviene negli esami scritti e orali, nella redazione e presentazione della tesi.

Capacità di apprendimento
Le capacità di apprendimento e di studio autonomo sono acquisite anzitutto attraverso il metodo di insegnamento, orientato al problem posing and solving, così da coinvolgere al massimo possibile lo studente nel processo di apprendimento, nella elaborazione e applicazione delle conoscenze relative ai contenuti del Corso di Laurea magistrale.
La capacità di apprendimento è favorita dall'uso autonomo di testi, dalla ricerca e lo studio di documentazione e pubblicazioni reperite dalle risorse elettroniche e sul Web. Lo studente perfeziona la capacità di apprendimento nelle attività di laboratorio, nello stage, nella interazione con i docenti e nello sviluppo della prova finale.
Tale capacità viene verificata attraverso gli esami relativi ai singoli insegnamenti e nella prova finale.

Insegnamenti

Prova finale

La prova finale consiste nella presentazione di una tesi elaborata in modo originale dallo studente sotto la guida di un Relatore. Viene favorita la produzione e la discussione in lingua inglese della tesi.
La prova finale ha l'obiettivo di verificare la qualità complessiva del lavoro svolto e le capacità del candidato di comunicare, giustificare e individuare collegamenti logici tra diverse tematiche scientifiche. Il lavoro di tesi può essere svolto anche nell'ambito dello stage.

Sbocchi occupazionali

1. Data Scientist (Scienziato dei dati); 2. Analytical Data Scientist (Scienziato dei dati - Analytical); 3. Business Data Scientist (Scienziato dei dati - Business).

funzione in un contesto di lavoro:
Il laureato in Data Science:
- individua e utilizza soluzioni innovative nel campo della acquisizione, gestione e analisi di insiemi di dati (dataset nel seguito); in particolare, sceglie, confronta, adatta, applica le tecniche, le metodologie e gli ambienti di analisi statistica e le tecniche, i linguaggi e le tecnologie informatiche (nel seguito, verrà usata la dizione sintetica tecniche statistiche e tecnologie informatiche) di analisi dei dati.
- sceglie e utilizza tecniche statistiche e tecnologie informatiche di analisi di dati per fornire valore economico e sociale ai processi decisionali e operativi.
Il corso di Laurea magistrale prevede di formare le seguenti figure professionali:

1. Data Scientist

Le funzioni specifiche del Data Scientist sono:
- analizzare e presentare i dati a fini descrittivi, predittivi e prescrittivi
- interagire con lo specialista di dominio nella individuazione di tecniche statistiche e tecnologie informatiche per la analisi di dominio
- analizzare gli eventi e i fatti di interesse della organizzazione in cui opera, alla luce dei dati e dei segnali provenienti dal Web, dall'Internet delle cose e i Social media
- gestire il ciclo di pubblicazione degli open data.

2. Analytical Data Scientist

Le funzioni specifiche dell' Analytical Data Scientist sono:
- confrontare, scegliere, adattare, applicare tecniche statistiche e tecnologie informatiche per l'analisi dei dati
- progettare ad alto livello servizi basati su dati digitali, anche attraverso l'utilizzo di dati provenienti dal Web, dall'Internet delle cose e i Social media
- collaborare con il professionista informatico nella progettazione e nella implementazione di servizi basati su dati digitali.

3. Business Data Scientist:

Le funzioni specifiche del Business Data Scientist sono:
- scegliere le tecniche statistiche e tecnologie informatiche che creano valore per i processi decisionali della organizzazione a supporto strategico ed operativo
- concepire nuovi servizi basati su dati digitali, che portano valore d'uso all'utente e valore di scambio al fornitore del servizio, anche attraverso l'utilizzo e l'analisi di dati provenienti dal Web, dall'Internet delle cose e i Social media.
- collaborare nella definizione delle strategie e delle scelte della organizzazione in cui opera, legate alla valorizzazione dei dati per pianificare gli investimenti, generare vantaggio competitivo e creare nuovi modelli di business.

competenze associate alla funzione:
Per Data Scientist: Analisi statistica; data management; competenze sociali giuridiche ed economiche dei processi di digitalizzazione.

Per Analytical Data Scientist: Analisi statistica con tecniche di apprendimento e orientate a Big Data; modellistica orientata alle decisioni; Big Data management; progettazione tecnica di servizi basati su dati digitali.

Per Business Data Scientist: Data driven process management; progettazione orientata al valore di servizi basati su dati digitali; competenze economiche sui processi di digitalizzazione.

sbocchi professionali:
Per tutti i profili: grandi, medie e piccole aziende, pubbliche amministrazioni, enti di ricerca, libera professione.

Valutazione degli studenti

Docenti di riferimento
SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI (ING-INF/05)
STATISTICA ECONOMICA (SECS-S/03)
SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI (ING-INF/05)
RICERCA OPERATIVA (MAT/09)
SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI (ING-INF/05)
INFORMATICA (INF/01)
STATISTICA ECONOMICA (SECS-S/03)