Indietro

Insegnamento

DATA ANALYSIS

Docente

MARTA CIMITILE

1. Conoscenze e competenze da acquisire

L'obiettivo del corso è fornire allo studente le conoscenze sull'importanza dell'analisi dei dati e sulle principali tecniche utilizzate per questo scopo.
Nell'ambito dell'analisi di dati, il corso analizzerà le diverse tipologie di dati e le tecniche di descrizione dei dati, oltre all'introduzione delle principali tematiche di calcolo della probabilità e statistica.
In particolare, lo studente al termine del corso sarà in grado di risolvere problemi semplici di analisi dei dati partendo dalla definizione del dominio di analisi, il recupero e la pulizia di dati grezzi, e la conoscenza delle principali tecniche algoritmiche per la risoluzione di alcuni problemi di base e la loro applicazione in diversi ambiti.
Particolare focus sarà rivolto alla acquisizione dei concetti di Data Mining, Machine Learning fino a cenni sul concetto di Reti Neurali.
Alle conoscenze teoriche si aggiungeranno esempi di pseudocodice per illustrare al meglio gli algoritmi in uso e esempi di utilizzo dei principali linguaggi e tool per l’analisi dei dati.

2. Programma / Contenuti

Il corso non ha propedeuticità ma il possesso di conoscenze di statistica e matematica agevolano la comprensione degli argomenti trattati e la preparazione dell’esame.
Il corso tratta gli elementi che un data scientist deve padroneggiare: la definizione del dominio di analisi, il recupero e la pulizia di dati grezzi, i modelli statistici, fino all'applicazione di algoritmi di machine learning. I concetti introdotti riguardano l’intero ciclo di vita della realizzazione di un progetto di Data Science descrivendo le attività che vanno dalla preparazione dei dati prima di un'analisi fino alla presentazione e comunicazione dei risultati di analisi ottenuti. Tutti i passaggi chiave sono corredati da esempi applicativi per illustrare al meglio i concetti e gli algoritmi mediante l’uso di strumenti noti per l’analisi dei dati.

Più in dettaglio, il programma del corso prevede i seguenti moduli formativi:
Introduzione alla Data Science
Dati e Tipi
Esercitazione di introduzione a Rapid Miner
Ciclo di Vita dei progetti di Data Science
Cenni di Statistica
Machine Learning
Esercitazione: Classificazione
Esercitazione: Predizione
Esercitazione: Anomaly Detection
Esercitazione: Clustering
Cenni alle Reti neurali
Presentazione del dato

3. Testi di studio

1. Data science: guida ai principi e alle tecniche base della scienza dei dati / Sinan Ozdemir. - Milano : Apogeo, 2017
2. La Scienza dei Dati, Carlo Batini, Federico Cabitza, Paolo Cherubini, Anna Ferrari, Andrea Maurino, Roberto Masiero, Matteo Palmonari, Fabio Stella (https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=&ved=2ahUKEwjo5azx2Nf6AhX3RPEDHYZWA5kQFnoECBgQAQ&url=https%3A%2F%2Fboa.unimib.it%2Fretrieve%2Fhandle%2F10281%2F295980%2F438709%2FTesto%2520completo%2520DS-CC.pdf&usg=AOvVaw1nVQ8oHdDjr1x2wR1X_LZW)

4. Metodi, strategie e strumenti didattici

Il corso è costituito da video lezioni erogate in modalità asincrona che lo studente può visionare anche più volte senza vincoli spazio temporali, utilizzando un PC o un dispositivo mobile con connessione Internet veloce. A questa risorsa formativa principale si affiancano le slide delle lezioni in formato pdf, documenti e riferimenti di approfondimento, e quiz di autoverifica dell’apprendimento.
La didattica asincrona è integrata da momenti di didattica sincrona e interattiva svolta attraverso web seminar tipicamente dedicati all’approfondimento o il riepilogo di un argomento di esame, allo studio di casi e tematiche di attualità, al chiarimento di dubbi nei giorni precedenti le date di esame, e alla trattazione di temi integrativi rispetto al programma del corso.
La comunicazione con il docente e il tutor può avvenire mediante l’invio di messaggi attraverso la piattaforma e-learning o direttamente via email, mediante la partecipazione ai forum di discussione, alle chat e ai webinar, o ai ricevimenti in presenza presso la sede principale dell’ateneo e quelle dei poli didattici decentrati.

5. Prove di verifica delle conoscenze

Lo studente potrà verificare l’acquisizione delle conoscenze acquisite mediante lo svolgimento di compiti e/o quiz di verifica dell’apprendimento costituiti da domande a risposta multipla.

6. Modalità di valutazione finale dell’apprendimento

La valutazione delle conoscenze e delle competenze acquisite dal discente è svolta mediante un esame di fine corso. L'esame è in forma orale. Allo studente vengono poste alcune domande sugli argomenti del corso e può essere chiesto di presentare in modo approfondito un eventuale argomento (corredato da e-tivity) trattato durante uno dei webinar del corso. L’esame può essere somministrato anche in forma scritta mediante domande a risposta chiusa e aperta.

7. Modalità e contesti di applicazione professionale delle conoscenze acquisite

L’introduzione dei Sistemi Informativi in ambito pubblico e privato ha fatto sì che ogni organizzazione e individuo abbia a disposizione grosse quantità di dati che se opportunamente utilizzate offrirebbero nuovi vantaggi competitivi.

I dati, in effetti, sono ovunque intorno a noi ma per poterli utilizzare è necessario trasformarli in informazioni e quindi saperli analizzare e renderli fruibili.
Per questo motivo il mondo del lavoro sempre più spesso richiede nuove figure professionali in grado di gestire i processi di organizzazione e fruizione dei dati.

Le conoscenze e le capacità acquisite mediante il corso trovano pertanto applicazione in tutti i contesti aziendali, e in particolare in quelli di dimensione medio e grandi, in cui dipendenti e manager si trovano ad operare, ciascuno per il proprio ruolo, con grosse quantità di dati che e hanno necessità di trasformarle in informazioni utili per poter prendere delle decisioni e per poter comprendere fenomeni reali.

8. Note (eventuali)