Search Google Appliance

Statistica 2

  • Edizioni di altri A.A.:
  • 2017/2018
  • 2018/2019
  • 2019/2020
  • 2020/2021

Dati insegnamento


Lingua Insegnamento:
Le lezioni saranno svolte in Italiano. Slides e libri di testo saranno principalmente il lingua Inglese. 
Testi di riferimento:
Dispense del corso ed esercitazioni pratiche utili per gli studenti non frequentanti
James, Witten, Hastie, Tibshirani (2013) An Introduction to Statistical Learning (with Applications in R), Springer-Verlag
Hastie, Tibshirani, Friedman (2009) The elements of statistical learning: data mining, inference and prediction. 2nd edition, Springer-Verlag
Wickham (2016) ggplot2. Elegant Graphics for Data Analysis. 2nd Edition, Springer-Verlag
Maindonald, Braun (2010) Data Analysis and Graphics Using R: An Example-Based Approach . 3rd edition, Cambridge University Press

In italiano si consiglia
Azzalini, Scarpa (2004) Analisi dei dati e data mining, Springer-Verlag 
Obiettivi formativi:
L’insegnamento si inserisce nel generale obiettivo del corso di studio di fornire conoscenza riguardo all’analisi dei dati in ambito aziendale. L’insegnamento si propone di fornire allo studente gli strumenti per estrarre informazioni rilevanti da grandi moli di dati, con particolare attenzione all'apprendimento statistico (statistical learning) sia in contesto predittivo che non (apprendimento supervisionato e non).

RISULTATI DELL'APPRENDIMENTO ATTESI
L'insegnamento prevede di completare la formazione dello studente con nozioni e strumenti utili ad approfondire gli aspetti dell’analisi statistica in ambito aziendale. La formazione sarà quindi completata e arricchita dalle seguenti competenze:

Conoscenza e capacità di comprensione
- Conoscenza di concetti statistici per l’analisi multivariata e relativa terminologia specializzata
- Capacità di applicare i principi di ragionamento statistico nell'elaborazione e nell'interpretazione dei report aziendali
- Capacità di utilizzare il software R per l’analisi statistica

Autonomia di giudizio
- Apprendere i concetti logici e statistici che sono indispensabili per lavorare autonomamente nella ricerca, selezione ed elaborazione di dati aziendali e utilizzando fonti statistiche ufficiali.

Abilità comunicative
- Imparare la terminologia e le tecniche statistiche di analisi multivariata per comunicare o discutere correttamente i risultati dell'analisi dei dati aziendali e dei report aziendali 
Prerequisiti:
Conoscenze di matematica generale, algebra delle matrici e statistica inferenziale. 
Metodi didattici:
Lezione frontale ed esercitazioni in aula informatica con utilizzo del software R 
Modalità di verifica dell'apprendimento:
L’esame si articola in una prova scritta di 60 minuti (domande aperte con spazio predefinito, volte a
verificare la conoscenza della parte teorica degli argomenti trattati a lezione) e in una presentazione orale di un report redatto per l’analisi di due diversi data sets mediante l’uso del software R.

Nell’ambito dell’esame, le due prove hanno uguale importanza e devono entrambe essere superate per la finalizzazione dell’esame. Il voto finale sarà dato dalla media dei punteggi (in trentesimi) parziali ricevuti dallo studente nelle due prove. 
Altre Informazioni:
E-mail: ippoliti@unich.it

Giorni ed orari di ricevimento studenti: Martedì 16:00 – 18:00 e per appuntamento da concordarsi via e-mail. 

Il corso prevede la trattazione dei seguenti argomenti per il raggiungimento dei risultati di apprendimento attesi: introduzione al data mining e statistical learning, Tecniche di visualizzazione dei dati, Tecniche di regressione e classificazione, Apprendimento non supervisionato (analisi delle componenti principali e metodi di raggruppamento)


Il corso si propone di introdurre metodi e modelli per estrarre informazioni rilevanti da grandi moli di dati, con particolare attenzione all'apprendimento statistico (statistical learning) sia in contesto predittivo che non (apprendimento supervisionato e non). Al fine di fornire le competenze per l'analisi e la modellazione di dati reali, le lezioni saranno integrate da esercitazioni in R svolte in aula informatica.

Programma:
Introduzione al data mining e statistical learning.

Tecniche di visualizzazione dei dati.
Regressione e Classificazione: regressione lineare multipla, regressione logistica, analisi discriminante e K-nearest neighbors.

Metodi non-lineari (regressione flessibile): regressione polinomiale, splines di regressione, splines di lisciamento, modelli additivi generalizzati.

Apprendimento non supervisionato: regole di associazione, analisi delle componenti principali, metodi di raggruppamento.