MATERIALE R      Home

Data mining and machine learning lab:  Avvisi

MATERIALE DEL CORSO



R - SOFTWARE


Per l'ambiente R, i suoi package e la documentazione fate riferimento al sito del progetto R.

MANUALI

In rete sono disponibili diversi manuali R. Alcuni sono elencati qui.

An introduction to R PDF
The R language definition PDF
Writing R extensions  PDF
R Data import/export PDF
R  Installation PDF
The R reference index PDF
Using R for Data Analysis and Graphics -
Simple R PDF
Practical Regression and Anova using R PDF
Statistical Computing and Graphics Course  PDF
Econometrics in R PDF


Orario lezioni:
  • 23/03/18:   13:30 - 15,    15:15 - 16:45
  • 06/04/18:   13:30 - 15,    15:15 - 16:45
  • 13/04/18:   13:30 - 15,    15:15 - 16:45
  • 20/04/18:   13:30 - 15,    15:15 - 16:45
  • 27/04/18:   13:30 - 15
  • 04/05/18:   13:30 - 15
  • 11/05/18:   13:30 - 15
  • 18/05/18:   13:30  -15,   15:15 – 16:00

Ricevimento: scrivere a frasca@di.unimi.it , anche per  eventualmente fissare un appuntamento.

LEZIONI

Lezione 1-p1 Lezione 1-p2  (23/03/2018). Introduzione al corso. Breve finestra sul linguaggio R: strutture dati, script e funzioni. Soluzioni esercizi. Partition.R.

Lezione 2  (06/04/2018). Principali variabili aleatorie in R. Grafici delle funzioni di densitÓ/massa di probabilitÓ e di ripartizione.  Distribuzioni empiriche. Esercitazioni. votiannuali.txt. Soluzioni esercizi.

Lezione 3
  (13/04/2018). Implementazione ed esercizi sul metodo massima verosimiglianza. Selezione del modello e stima degli errori di training e di test. Cross Validazione. Esempio pratico, classificazione binaria. Classificatore k-NN. Soluzioni esercizi.

Lezione 4  (20/04/2018). Ancora sul classificatore kNN. Alberi di decisione., complessitÓ e pruning dell'albero. Esercitazione pratica con il package R rpart.

Lezione 5  (27/04/2018). Classificazione con dati sbilanciati. Esempio di albero di decisione cost-sensitive.

Lezione 6  (04/05/2018). Esercitazione kNN e alberi di decisione. Introduzione alle random forest.

Lezione 7  (11/05/2018). Random forest in R. Accenni ai problemi multi-classe e multi-etichetta

Lezione 8-p1 Lezione 8-p2 (18/05/2018). SVM in R. Accenni ai problemi di apprendimento semi-supervisionato. Modelli di apprendimento basati su grafi. Reti di Hopfield e classificatori basati su reti di Hopfield: GAIN e COSNet.