Il corso prevede lo studio di  metodi matriciali per il  Data Mining.
L'informazione contenuta in grandi quantità di dati è usata per esempio dai motori di ricerca (es. Google) o nello studio di dati climatici, nel pattern recognition, nell'analisi di discriminanza in patologie mediche ecc.
Queste applicazioni  richiedono spesso la risoluzione numerica di sistemi lineari di enormi dimensioni, di problemi agli autovalori e valori singolari di grandi dimensioni, il calcolo di funzioni di matrici  e la gestione di grafi.

 Il corso si prefigge di descrivere alcune tecniche di analisi molto ricorrenti nel "data mining" in svariati ambiti applicativi che hanno necessita' di gestire grandi moli di dati, e che utilizzano in modo efficace i metodi dell'algebra lineare numerica.

Programma di massima:
1. Richiami di algebra lineare numerica
  - Problema ai minimi quadrati
  - Approssimazione di autocoppie di matrici di grandi dimensioni
2.  Alcune applicazioni (information retrieval, discriminant analysis, reduction processes, ...)  quali ad esempio:
  - Principal component regression
  - Analisi delle componenti principali (PCA)
  - Metodi di classificazione
  - Clustering gerarchico e centrato sulle medie ed applicazioni
  - Fattorizzazioni non negative approssimate ed applicazioni

Prerequisiti:
Concetti fondamentali di Analisi Matematica.
Algebra Lineare di base (spazi vettoriali, matrici, vettori, norma, proprieta' variazionali ...)
ed aspetti computazionali (QR, Choleski, LU, Autovalori, SVD, ...)
Conoscenze di base dell'ambiente computazionale Matlab.


Il corso prevede attività pratiche di Laboratorio per lo sviluppo dei codici


Testi di riferimento:
1. Lucidi delle lezioni,
2. R. Horn e C. Johnson, Matrix Analysis , Cambridge Univ. Press, 1985.
2. L. Elden, Matrix Methods in Data Mining and Pattern Recognition , SIAM, April 2007.